Skip to main content

Login for students

Login for employees

Publication detail

Text categorization with Feature Dictionary ? Problem of Czech Language
Authors: Janáková Hana
Year: 2004
Type of publication: článek v odborném periodiku
Name of source: WSEAS Transactions on Information Science and Applications
Publisher name: WSEAS Press
Place: Atény
Page from-to: 368-372
Titles:
Language Name Abstract Keywords
cze Textová kategorizace s využitím slovníku charakteristických znaků - problém českého jazyka Množství dokumentů na Internetu nás nutí vytvářet nástroje, které pomohou uživatelům při hledání na webu. Tyto nástroje mají odlišnou kvalitu, některé z nich jsou specializované na určitou oblast (biologie, chemie, IT) nebo místně (USA, Germany, ČR), některé představují pouze seznam témat, jiné používají vyhledávací stroje. Český jazyk je příliš bohatý, proto existuje mnoho problémů při vyhledávání. Slovník charakteristických znaků se jeví jako velmi dobrý pomocník při procesu vyhledávání. Jeden z možných návrhů je ukázán v tomto článku.
eng Text categorization with Feature Dictionary ? Problem of Czech Language Quantity of Internet documents is forcing us to create tools, which can help users browsing the Web. These tools have different quality, some of them are specialized either on branch (biology, chemistry, IT) or on locality (USA, Germany, ČR), some of them are only lists of topic in contrast to others using crawlers, and so on. Czech language is too colourful and various, therefore we have to face problems arising in Czech search engines. Feature dictionary could be useful assistant in process of document searching if designed well. One of the possible designs is showed at the end of the article. categorization, text mining, data mining, feature dictionary, classification, stem, stop word