Morfologické značkování mluvených korpusů, zkušenosti a otevřené otázky

Varování

Publikace nespadá pod Ekonomicko-správní fakultu, ale pod Fakultu informatiky. Oficiální stránka publikace je na webu muni.cz.
Autoři

HLAVÁČKOVÁ Dana OSOLSOBĚ Klára

Rok publikování 2008
Druh Článek ve sborníku
Konference Čeština v mluveném korpusu
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
Obor Jazykověda
Klíčová slova corpus; spoken corpora; tagging
Popis Cílem příspěvku je: a) Stručně shrnout zkušenosti získané při úpravách nástrojů primárně určených pro automatickou morfologickou analýzu psané češtiny s cílem rozšířit jejich použitelnost pro anotace mluvených korpusů. b) Představit nástroj upravenou verzi automatického morfologického analyzátoru ajka použitou pro automatické značkování mluvených korpusů. c) Podělit se o konkrétní zkušenosti s automatickou morfologickou analýzou a následnou ruční disambiguací automaticky označkovaných částí Brněnského mluveného korpusu (BMK) a Korpusu soukromé korespondence (KSK) oba vytvořeny v Ústavu českého jazyka FF MU. d) Na základě výše uvedených zkušeností zhodnotit klady a zápory, meze a možnosti automatické morfologické analýzy mluvených textů.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.