Vyhledávání a analýza popisujících výjezdy hasičského záchranného sboru
Autoři | |
---|---|
Rok publikování | 2011 |
Druh | Článek ve sborníku |
Konference | Sborník konference Znalosti 2011 |
Fakulta / Pracoviště MU | |
Citace | |
Obor | Informatika |
Klíčová slova | machine learning; data mining; fireman brigade; text classification; text preprocessing; lemmatization |
Popis | Článek se zabývá problematikou dohledávání textů na internetu dle informací o výjezdech hasičského záchranného sboru a následnou klasifikací získaných textů do různých kategorií. Databáze výjezdů obsahovala celkem 116 000 záznamů. Vybrali jsme 4110 záznamů podle závažnosti zásahu a pokusili se dohledat odpovídající texty na internetu. Úspěšní jsme byli v 2956 případech. Popisujeme metodu sběru textů a dolování ze získané textové informace. Nejvyšší celková správnost klasifikace textů do tříd dle typů výjezdu dosáhla 84 %, a podle geografického členění do krajů 60 %. Diskutujeme vhodnost různých metod strojového učení a vhodnost či nevhodnost lematizace. |
Související projekty: |