The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Полезные лингвистические Perl модули, преобразование и определение кодировки

Дата
22 Dec 2003
ЗаголовокПолезные лингвистические Perl модули, преобразование и определение кодировки
Пояснение
  • Lingua::Ispell - проверка орфографии;
  • Lingua::Ident - автоопределение языка по отрывку текста;
  • Lingua::Num2Word - преобразование цифр в буквенное написание;
  • Lingua::RU::Number - буквенное написание денежной суммы (в рублях);
  • Lingua::RU::PhTranslit - преобразование текста в правильный транслит или другую русскую кодировку;
  • Lingua::DetectCharset, Lingua::DetectCyrillic - определение русской кодировки по отрывку текста;
  • PerlIO::locale - прозрачное перекодирование текста при чтении и записи в файл;
  • Convert::Cyrillic - преобразование из одной кодировки в другую (включая поддержку UTF-8);
  • Snowball Stemmer - работа с русскими словарными формами (стемминг, выделение корня убирая суффиксы и окончания). perl интерфейс (для стеммера любого языка) - "Lingua::Stem::Snowball".
  • В сети так-же доступны исходные тексты стеммера от Andrew Kovalenko, см. так же статью Вероятностный морфологический анализатор русского и украинского языков.
  • Home URLhttp://search.cpan.org/
    Флагenglish
    Обновление26 Mar 2013
    Стаб. вер.5.16.3
    РазделПолезные Perl модули.
    Ключи

     Добавить ссылку
     
     Поиск ссылки (regex):
     

    Последние заметки
    << Предыдущие 15 записей
    - 13.03.2020 Использование tor из состава Tor Browser без запуска самого браузера
    - 05.03.2020 Конвертация Chrome-дополнения для запуска в Firefox
    - 23.02.2020 Генерация конфигурации клиента OpenSSH из inventory.ini в Ansible
    - 22.02.2020 Преобразование закрытого ключа PuTTY для использования в OpenSSH
    - 21.02.2020 Использование SSH-ключей в Gitlab CI
    - 20.02.2020 Как отбить простой DDoS в nginx
    - 19.02.2020 Аудит системных пользователей (можно через Ansible)
    - 18.02.2020 Просмотр зависимостей пакета и принадлежности файла пакету в Linux
    - 05.01.2020 Решение проблемы с зависанием графической подсистемы на компьютерах с APU AMD
    - 04.01.2020 Проверка правописания в Telegram Desktop для Linux
    - 03.01.2020 Простое устройство для защиты данных в случае кражи ноутбука
    - 18.11.2019 Обход блокировки сотовыми операторами использования смартфона в качестве точки доступа
    - 09.09.2019 Включение DNS-over-HTTPS в Chrome
    - 01.09.2019 Улучшение безопасности sources.list в дистрибутивах, использующих APT
    - 28.08.2019 Сравнение работающих в пространстве пользователя обработчиков нехватки памяти
    Следующие 15 записей >>




    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру