[
новости
/
+++
|
форум
|
теги
|
]
TextCat - implementation of the text categorization algorithm
Дата
15 Sep 2004
[
исправить
]
Заголовок
TextCat - implementation of the text categorization algorithm
Пояснение
Реализация алгоритма "N-Gram-Based Text Categorization" (на Perl) статистического анализа текста для автоматического определения языка на котором написан текст (для русского языка производится также определение кодировки).
Статья отражающая суть алгоритма
(на русском языке).
Home URL
http://odur.let.rug.nl/~vannoord/TextCat/
Флаг
russian
Раздел
Полезные Perl модули.
Преобразование из одной кодировки в другую
Ключи
rus
,
codepage
,
language
, (
найти похожие документы
)
Добавить ссылку
Поиск ссылки (
regex
):
Последние заметки
<< Предыдущие 15 записей
Партнёры:
Хостинг:
Закладки на сайте
Проследить за страницей
Created 1996-2024 by
Maxim Chirkov
Добавить
,
Поддержать
,
Вебмастеру