Informace o publikaci

Automatic Identification of Speakers and Parties in Steno Protocols of the Czech Parliament

Autoři

MIKUŠEK Ota

Rok publikování 2022
Druh Článek ve sborníku
Konference Proceedings of the Sixteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2022.
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
www
Klíčová slova scikit-learn; embedding; SVM; random forest; naive Bayes; ngram; CountVectorizer; classification
Popis There are many methods of machine learning. This paper shows an application of basic machine learning methods like bag of words, random forest and naive Bayes on classification task of assigning sentences to members and parties of the Czech Parliament.

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.

Další info