Zde se nacházíte:
Informace o publikaci
Pattern Generation Revisited
Název česky | Generování vzorů |
---|---|
Autoři | |
Rok publikování | 2001 |
Druh | Článek ve sborníku |
Konference | Proceedings of the Twelfth European TeX Conference |
Fakulta / Pracoviště MU | |
Citace | |
www | |
Obor | Využití počítačů, robotika a její aplikace |
Klíčová slova | patterns;UNICODE;finite automata;natural language processing;language engineering |
Popis | Článek popisuje techniku vzorů jako prostředek pro získávání informace z~rozsáhlých dat a zpětné rozpoznávání. Typickou aplikací této techniky je dělení slov. Dosud chybí generátor vzorů dělení pro systém $\Omega$ (pro UNICODE) a rozšíření programu PATGEN, omezeného osmibitovým ASCII, není únosné. Proto jsme vyvinuli knihovnu PATLIB pro obecnou manipulaci se vzory a na ní postavili generátor vzorů dělení slov v~UNICODE. Popsali jsme architekturu systému a dále méně známou datovou strukturu dynamic packed trie, kterou lze výhodně použít pro efektivní ukládání konečných jazyků s výstupy. Vzory lze použít i pro rozpoznávání hranic složených slov, proto zmíníme návrhy na rozšíření následníků TeXu o klasifikované dělení s~více typy dělících bodů a o automatické potlačování ligatur na švech složených~slov. |
Související projekty: |