Propria (příjmení na -č) - problém automatické morfologické analýzy

Varování

Publikace nespadá pod Ekonomicko-správní fakultu, ale pod Filozofickou fakultu. Oficiální stránka publikace je na webu muni.cz.
Autoři

OSOLSOBĚ Klára

Rok publikování 2008
Druh Článek ve sborníku
Konference Jazyk a jeho proměny
Fakulta / Pracoviště MU

Filozofická fakulta

Citace
Obor Jazykověda
Klíčová slova corpus; proprium; family name; authomatical morphological analysis
Popis Ačkoliv se rozsáhlé jazykové korpusy od doby vzniku korpusové lingvistiky budují především pro potřeby lexikografie, mohou sloužit a slouží i pro bádání v řadě dalších lingvistických oborů. V tomto příspěvku jsme se snažili demonstrovat, jak mohou korpusy přispět při zpracování lingvistických podkladů použitelných v oblasti NLP. Na příkladu analýzy vlastních jmen (maskulin životných na č) jsme ukázali, na jaká úskalí mohou narazit pokusy vytvořit automatický modul derivace konkrétně českých deverbativ na -č. Výsledkem je rozsáhlý seznam možných případů přegenerovávání, kterých by se mohl automatický nástroj dopustit v případě, že by nepracoval dostatečně s rozdílem apelativum/proprium.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.