Informace o projektu
Elektronický paralelní česko-německý korpus
- Kód projektu
- ROZV/58/2003
- Období řešení
- 1/2003 - 12/2003
- Investor / Programový rámec / typ projektu
-
Ministerstvo školství, mládeže a tělovýchovy ČR
- Transformační a rozvojové programy
- Fakulta / Pracoviště MU
- Pedagogická fakulta
- Další fakulta/pracoviště MU
-
Fakulta informatiky
- doc. RNDr. Pavel Smrž, Ph.D.
Č. projektu z r. 2001: I/43/2001
Č. projektu z r. 2002: 31/2002
Cílem projektu v roce 2003 je rozšířit korpus na min. 3 miliony slov v české části; zpřesnt zarovnání celého korpusu na co nejmenší jednotku (ideálně na větu); zpřesnit tagování české části automatickou desambiguací, případně vyvinout dokonalejší anotační software; vyvažovat proporce korpusu zařazováním většího množství odborných a publicistických textů; vyvážit poměr českých a německých originálních textů na 1:1; informovat odbornou veřejnost o vzniku korpusu; zajistit další zdroje paralelních textů; zaškolit další studenty pro práci s texty.