Informace o projektu
Počítačový korpus českých psaných textů (Počítačový fond češtiny)
- Kód projektu
- GA405/93/0218
- Období řešení
- 1/1993 - 1/1995
- Investor / Programový rámec / typ projektu
-
Grantová agentura ČR
- Standardní projekty
- Fakulta / Pracoviště MU
- Fakulta informatiky
- Další fakulta/pracoviště MU
-
Filozofická fakulta
- Spolupracující organizace
-
Ústav pro jazyk český AV ČR, v. v. i.
- Odpovědná osoba PhDr. Věra Schmiedtová
- Odpovědná osoba doc. RNDr. Vladimír Petkevič, CSc.
- Odpovědná osoba PhDr. Alla Bémová, CSc.
Cílem projektu je vytvořit reprezentativní korpus českých psaných textů v rozsahu 20 miliónů slovních tvarů a na jeho základě pak v druhé fázi připravit velký Slovník českého jazyka. Výsledky projektu budou k dispozici v následujících podobách: a) souhrnná výzkumná zpráva obsahující informace o korpusu a jeho vytváření, b) vlastní korpus uložený ve standardním formátu na počítačových médiích, c) soubor nástrojů - algoritmů a programů pro práci na korpusu, d) v konečné fázi (nikoli v rámci tohoto grantu) Slovník českého jazyka. Na projektu se budou podílet přední odborníci v současné i historické bohemistice, lexikografii a počítačové lingvistice, kteří pocházejí z univerzitních pracovišť na filozofické fakultě Karlovy a Masarykovy univerzity, dále z pracoviště na Matematicko-fyzikální fakultě UK a také z Ústavu pro jazyk český AV ČR.