Открыт доступ (http://company.yandex.ru/grant/list.xml) к более чем двадцати работам, участвовавшим в конкурсе на получения грантов от компании Yandex.
Можно выделить следующие интересные материалы:
- Некоторые способы определения географической привязки IP адресов. (http://company.yandex.ru/grant/2005/05_Dobrov_103032.pdf)
Анализ текста.
- Формирование многоязычных словарей и их использование при кросс-языковом поиске информации. (http://company.yandex.ru/grant/2005/01_Abramova_102704.pdf)
- Снятие лексико-семантической омонимии в новостных и газетно-журнальных текстах: поверхностные фильтры и статистическая оценка. (http://company.yandex.ru/grant/2005/01_Kobritsov_103002.pdf)
- Интерактивное разрешение лексической и синтаксической неоднозначности в системах автоматической обработки естественного языка. (http://company.yandex.ru/grant/2005/01_Lazursky_102921.pdf)
- Сравнение эффективности двух методик снятия лексической и морфологической неоднозначности для русского языка (скрытая модель Маркова и синтаксический анализатор именных групп). (/grant/2005/01_Sokirko_92802.pdf)
- Автоматическое реферирование веб-документов с учетом запроса. (http://company.yandex.ru/grant/2005/11_Braslavski_102707.pdf)
Распознавание изображений
- Быстрая классификация JPEG–изображений. (http://company.yandex.ru/grant/2005/03_Dorogov_102608.pdf)
- Распознавание типовых портретных изображений в задаче автоматической классификации. (http://company.yandex.ru/grant/2005/03_Smirnov_102804.pdf)
Технологии индексации и ранжировния
- Исследование эффективности алгоритмов выполнения алгебраических операций к XML-данным в распределенных запросах. (http://company.yandex.ru/grant/2005/05_Khvostichenko_103107.pdf)
- Исследование эффективности применения методов совместного анализа текстов и гиперссылок для поиска тематических сообществ. (http://company.yandex.ru/grant/2005/06_Kozlov_102805.pdf)
- Оптимизация расчета ссылочной популярности и учета ее при ранжировании результатов поиска. (http://company.yandex.ru/grant/2005/06_Trofimenko_101803.pdf)
- Извлечение значимой информации из web-страниц для задач информационного поиска. (http://company.yandex.ru/grant/2005/07_Ageev_102942.pdf)
- Порождение кластеров документов-дубликатов: подход, основанный на поиске частых замкнутых множеств признаков. (http://company.yandex.ru/grant/2005/07_Kuznetsov_102820.pdf)
- Структура русскоязычной части глубинного Веба. (http://company.yandex.ru/grant/2005/07_Shestakov_102104.pdf) (динамический контент доступный через работу с формами);
Каталогизирвоание
- Оптимизация процедуры автоматического пополнения веб-каталога. (http://company.yandex.ru/grant/2005/08_Kiselev_102710.pdf)
- Классификация веб-страниц на основе алгоритмов машинного обучения. (http://company.yandex.ru/grant/2005/08_Petrov_103106.pdf)
- Автоматическая рубрикация web-страниц в интернет-каталоге с иерархической структурой. (http://company.yandex.ru/grant/2005/08_Shelestov_103119.pdf)
Агрегирование новостей
- Метод кластеризации текстов, учитывающий совместную встречаемость ключевых терминов, и его применение к анализу тематической структуры новостного потока, а также ее динамики. (http://company.yandex.ru/grant/2005/10_Kiselev_102930.pdf)
- Формирование выпуска новостей на основе автоматического анализа новостных сообщений. (http://company.yandex.ru/grant/2005/10_Korneev_102001.pdf)
- Обработка потока новостей на основе больших лингвистических ресурсов. (http://company.yandex.ru/grant/2005/10_Loukachevitch_103030.pdf)
URL: http://company.yandex.ru/grant/list.xml
Новость: https://www.opennet.ru/opennews/art.shtml?num=6170