Project information
Computers Corpus of Czech Written Text
- Project Identification
- GA405/93/0218
- Project Period
- 1/1993 - 1/1995
- Investor / Pogramme / Project type
-
Czech Science Foundation
- Standard Projects
- MU Faculty or unit
- Faculty of Informatics
- Other MU Faculty/Unit
-
Faculty of Arts
- Cooperating Organization
-
Institute of the Czech Language of the ASCR, v. v. i.
- Responsible person PhDr. Věra Schmiedtová
- Responsible person doc. RNDr. Vladimír Petkevič, CSc.
- Responsible person PhDr. Alla Bémová, CSc.
Cílem projektu je vytvořit reprezentativní korpus českých psaných textů v rozsahu 20 miliónů slovních tvarů a na jeho základě pak v druhé fázi připravit velký Slovník českého jazyka. Výsledky projektu budou k dispozici v následujících podobách: a) souhrnná výzkumná zpráva obsahující informace o korpusu a jeho vytváření, b) vlastní korpus uložený ve standardním formátu na počítačových médiích, c) soubor nástrojů - algoritmů a programů pro práci na korpusu, d) v konečné fázi (nikoli v rámci tohoto grantu) Slovník českého jazyka. Na projektu se budou podílet přední odborníci v současné i historické bohemistice, lexikografii a počítačové lingvistice, kteří pocházejí z univerzitních pracovišť na filozofické fakultě Karlovy a Masarykovy univerzity, dále z pracoviště na Matematicko-fyzikální fakultě UK a také z Ústavu pro jazyk český AV ČR.