Informace o publikaci

Pre-processing Large Resources for Family Names Research

Název česky Zpracování velkých zdrojů pro výzkum příjmení
Autoři

RAMBOUSEK Adam

Rok publikování 2016
Druh Článek ve sborníku
Konference RASLAN 2016 Recent Advances in Slavonic Natural Language Processing
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
www PDF full paper
Obor Informatika
Klíčová slova DEB platform; lexicography; big data; family names; data conversion
Popis Článek popisuje metodologii a nástroje použité pro zpracování archivních dokumentů v různých formátech a jejich konverzi do jednotného formátu. Zdroje byly použity pro výzkum původu a geografické distribuce příjmení ve Spojeném království, jako součást projektu Family Names in Britain and Ireland. Data extrahovaná z dokumentů a jejich vzájemné propojení se ukázalo jako cenný výzkumný zdroj, který urychlil lexikografický výzkum.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.

Další info