Publikace detail

Text categorization with Feature Dictionary ? Problem of Czech Language

Autoři: Janáková Hana

Rok: 2004

Druh publikace: článek v odborném periodiku

Název zdroje: WSEAS Transactions on Information Science and Applications

Název nakladatele: WSEAS Press

Místo vydání: Atény

Strana od-do: 368-372

Tituly:

Jazyk	Název	Abstrakt	Klíčová slova
cze	Textová kategorizace s využitím slovníku charakteristických znaků - problém českého jazyka	Množství dokumentů na Internetu nás nutí vytvářet nástroje, které pomohou uživatelům při hledání na webu. Tyto nástroje mají odlišnou kvalitu, některé z nich jsou specializované na určitou oblast (biologie, chemie, IT) nebo místně (USA, Germany, ČR), některé představují pouze seznam témat, jiné používají vyhledávací stroje. Český jazyk je příliš bohatý, proto existuje mnoho problémů při vyhledávání. Slovník charakteristických znaků se jeví jako velmi dobrý pomocník při procesu vyhledávání. Jeden z možných návrhů je ukázán v tomto článku.
eng	Text categorization with Feature Dictionary ? Problem of Czech Language	Quantity of Internet documents is forcing us to create tools, which can help users browsing the Web. These tools have different quality, some of them are specialized either on branch (biology, chemistry, IT) or on locality (USA, Germany, ČR), some of them are only lists of topic in contrast to others using crawlers, and so on. Czech language is too colourful and various, therefore we have to face problems arising in Czech search engines. Feature dictionary could be useful assistant in process of document searching if designed well. One of the possible designs is showed at the end of the article.	categorization, text mining, data mining, feature dictionary, classification, stem, stop word

Vyhledávání

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Ústavy

Pracoviště

Jak nás najdete?

Služby

Často hledáte