Project information
Inteligentní back office
- Project Identification
- CZ.01.1.02/0.0/0.0/21_374/0026711
- Project Period
- 7/2021 - 5/2023
- Investor / Pogramme / Project type
-
Ministry of Industry and Trade of the CR
- MU Faculty or unit
-
Faculty of Informatics
- doc. RNDr. Petr Sojka, Ph.D.
- Mgr. Mikuláš Bankovič
- Mgr. Martin Geletka
- RNDr. Vít Starý Novotný, Ph.D.
- Mgr. Michal Štefánik
- Cooperating Organization
-
Dactyl Group s.r.o.
- Responsible person Ing. Milan Doubek
- Responsible person Johnson Darkwah
Cílem projektu je vývoj moderního inovativního řešení pro elektronické zpracování a kontrolu finančních dokumentů za použití pokročilých nástrojů umělé inteligence. Výstupem projektu bude software využívaný v licencované webové službě. Vlastní řešení partneři vystaví na následujících komponentách: a) na unikátním propojení metod zpracování obrazu a přirozeného jazyka; b) na modelování jazyka; c) na pokročilých nástrojích pro extrakci textu z dokumentu s využitím neuronových sítí; d) na klasifikátoru pro přesnou kategorizaci zpracovávaných dokumentů; e) na automatizovaném detektoru nestandardních entit ve finančních dokumentech/ operacích, opřených o neuronovou architekturu tzv. „transformerů“; f) na navrženém a natrénovaném rekurentním modelu pro určení vztahů mezi dokumenty; a v neposlední řadě na g) nástroji pro validaci dokumentu a detekci anomálií s využitím vybraných statistických modelů. Zajímavým prvkem systému bude h) „doporučovač”, který uživateli poskytne radu pro další kroky v rámci prováděných pracovních úkonů. Funkční nadstavbou se stane i) přehledné grafické prostředí (dostupné z běžného internetového prohlížeče), které poskytne výstupy ve formě přehledných a snadno upravitelných „Business Intelligence“ reportů. V souladu s mezinárodní ambicí bude mít vyvíjené řešení podporu multijazyčnosti.
Sustainable Development Goals
Masaryk University is committed to the UN Sustainable Development Goals, which aim to improve the conditions and quality of life on our planet by 2030.
Publications
Total number of publications: 3
2023
-
Document Visual Question Answering with CIVQA: Czech Invoice Visual Question Answering Dataset
Recent Advances in Slavonic Natural Language Processing (RASLAN 2023), year: 2023
2022
-
Information Extraction from Business Documents
Recent Advances in Slavonic Natural Language Processing (RASLAN 2022), year: 2022
-
Towards General Document Understanding through Question Answering
Recent Advances in Slavonic Natural Language Processing (RASLAN 2022), year: 2022