Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Text categorization with Feature Dictionary ? Problem of Czech Language
Autoři: Janáková Hana
Rok: 2004
Druh publikace: článek v odborném periodiku
Název zdroje: WSEAS Transactions on Information Science and Applications
Název nakladatele: WSEAS Press
Místo vydání: Atény
Strana od-do: 368-372
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Textová kategorizace s využitím slovníku charakteristických znaků - problém českého jazyka Množství dokumentů na Internetu nás nutí vytvářet nástroje, které pomohou uživatelům při hledání na webu. Tyto nástroje mají odlišnou kvalitu, některé z nich jsou specializované na určitou oblast (biologie, chemie, IT) nebo místně (USA, Germany, ČR), některé představují pouze seznam témat, jiné používají vyhledávací stroje. Český jazyk je příliš bohatý, proto existuje mnoho problémů při vyhledávání. Slovník charakteristických znaků se jeví jako velmi dobrý pomocník při procesu vyhledávání. Jeden z možných návrhů je ukázán v tomto článku.
eng Text categorization with Feature Dictionary ? Problem of Czech Language Quantity of Internet documents is forcing us to create tools, which can help users browsing the Web. These tools have different quality, some of them are specialized either on branch (biology, chemistry, IT) or on locality (USA, Germany, ČR), some of them are only lists of topic in contrast to others using crawlers, and so on. Czech language is too colourful and various, therefore we have to face problems arising in Czech search engines. Feature dictionary could be useful assistant in process of document searching if designed well. One of the possible designs is showed at the end of the article. categorization, text mining, data mining, feature dictionary, classification, stem, stop word