Informace o projektu
A New Machine Translation-based approach to Parallel Corpora Alignment
- Kód projektu
- MUNI/IGA/1334/2021
- Období řešení
- 1/2022 - 12/2022
- Investor / Programový rámec / typ projektu
-
Masarykova univerzita
- Interní grantová agentura MU
- Fakulta / Pracoviště MU
- Fakulta informatiky
The project involves the development of a new automatic method of parallel corpora alignment. This new approach will be based on Neural Machine Translation and previous aligned corpora. The method will be tested on a Czech-English parallel corpus of Faculty news, which alignment will be improved as a result.
Cíle udržitelného rozvoje
Masarykova univerzita se hlásí k cílům udržitelného rozvoje OSN, jejichž záměrem je do roku 2030 zlepšit podmínky a kvalitu života na naší planetě.
Publikace
Počet publikací: 4
2022
-
HFT: High Frequency Tokens for Low-Resource NMT
Proceedings of the Fifth Workshop on Technologies for Machine Translation of Low-Resource Languages (LoResMT 2022), rok: 2022
-
MUNI-NLP Systems for Lower Sorbian-German and Lower Sorbian-Upper Sorbian Machine Translation @ WMT22
Proceedings of the Seventh Conference on Machine Translation, rok: 2022
-
Piötòst Ché Niènt, Mèi Piötòst - A Manually Revised Lombard-Italian Parallel Corpus
Proceedings of the Sixteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2022, rok: 2022
2021
-
Evaluating the State-of-the-Art Sentence Alignment System on Literary Texts
Recent Advances in Slavonic Natural Language Processing (RASLAN 2021), rok: 2021