Informace o publikaci

Vyhledávání a analýza popisujících výjezdy hasičského záchranného sboru

Autoři

GÉRYK Jan BAYER Jaroslav POPELÍNSKÝ Lubomír

Rok publikování 2011
Druh Článek ve sborníku
Konference Sborník konference Znalosti 2011
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
Obor Informatika
Klíčová slova machine learning; data mining; fireman brigade; text classification; text preprocessing; lemmatization
Popis Článek se zabývá problematikou dohledávání textů na internetu dle informací o výjezdech hasičského záchranného sboru a následnou klasifikací získaných textů do různých kategorií. Databáze výjezdů obsahovala celkem 116 000 záznamů. Vybrali jsme 4110 záznamů podle závažnosti zásahu a pokusili se dohledat odpovídající texty na internetu. Úspěšní jsme byli v 2956 případech. Popisujeme metodu sběru textů a dolování ze získané textové informace. Nejvyšší celková správnost klasifikace textů do tříd dle typů výjezdu dosáhla 84 %, a podle geografického členění do krajů 60 %. Diskutujeme vhodnost různých metod strojového učení a vhodnost či nevhodnost lematizace.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.

Další info