Publication detail

Text categorization with Feature Dictionary ? Problem of Czech Language

Authors: Janáková Hana

Year: 2004

Type of publication: článek v odborném periodiku

Name of source: WSEAS Transactions on Information Science and Applications

Publisher name: WSEAS Press

Place: Atény

Page from-to: 368-372

Titles:

Language	Name	Abstract	Keywords
cze	Textová kategorizace s využitím slovníku charakteristických znaků - problém českého jazyka	Množství dokumentů na Internetu nás nutí vytvářet nástroje, které pomohou uživatelům při hledání na webu. Tyto nástroje mají odlišnou kvalitu, některé z nich jsou specializované na určitou oblast (biologie, chemie, IT) nebo místně (USA, Germany, ČR), některé představují pouze seznam témat, jiné používají vyhledávací stroje. Český jazyk je příliš bohatý, proto existuje mnoho problémů při vyhledávání. Slovník charakteristických znaků se jeví jako velmi dobrý pomocník při procesu vyhledávání. Jeden z možných návrhů je ukázán v tomto článku.
eng	Text categorization with Feature Dictionary ? Problem of Czech Language	Quantity of Internet documents is forcing us to create tools, which can help users browsing the Web. These tools have different quality, some of them are specialized either on branch (biology, chemistry, IT) or on locality (USA, Germany, ČR), some of them are only lists of topic in contrast to others using crawlers, and so on. Czech language is too colourful and various, therefore we have to face problems arising in Czech search engines. Feature dictionary could be useful assistant in process of document searching if designed well. One of the possible designs is showed at the end of the article.	categorization, text mining, data mining, feature dictionary, classification, stem, stop word

Search

Login for students

Login for employees

Publication detail

Map

Services

Popular Links