The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Первый стабильный релиз системы распознавания текстов Cuneiform 1.0

02.07.2010 16:06

Вышла первая стабильная версия системы распознавания текста Cuneiform для платформы Linux. В новой версии проведена большая работа по исправлению ошибок и чистке исходных текстов, что дало разработчикам основание полагать о стабилизации кодовой базы проекта. Код Cuneiform для Linux распространяется под упрощенной лицензией BSD и основан на коде открытом компанией Cognitive Technologies в 2007 году.

OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи. Поддерживается более чем 20 языков. Отдельно стоит отметить отличную поддержку распознавания текста на русском и украинском языках. Результат распознавания может быть сохранен в форматах HTML, hOCR, RTF или PDF с сохранением особенностей начертания оригинала (выделение жирным, курсивом и т.д.).

  1. Главная ссылка к новости (https://launchpad.net/cuneifor...)
  2. OpenNews: Релиз YAGF 0.6.1, графической оболочки для системы распознавания текста Cuneiform
  3. OpenNews: Релиз открытой системы распознавания печатных текстов Cuneiform 0.7
  4. OpenNews: Графический интерфейс к системе распознавания текста Cuneiform под Linux
  5. OpenNews: Опубликован исходный код системы распознавания печатных текстов Cuneiform
  6. OpenNews: Открыты исходные тексты системы оптического распознавания CuneiForm
Автор новости: Ренат
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/27177-Cuneiform
Ключевые слова: Cuneiform, ocr
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (47) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Vitto74 (ok), 16:32, 02/07/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +3 +/
    Кто нибудь в курсе: он умеет распознавать блоки (аля блок текста, колонки, таблицы) без распознавания содержимого?
     
  • 1.2, Arcturus (?), 16:39, 02/07/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    Кто пользовался: как оно по сравнению с FineReader?
     
     
  • 2.3, Vitto74 (ok), 16:50, 02/07/2010 [^] [^^] [^^^] [ответить]  
  • +/
    >Кто пользовался: как оно по сравнению с FineReader?

    Сравнивать бесполезно - это консольная утилита. Качество распознавания довольно высокое, но только при достаточном разрешении: простой скрин экрана с текстом не распознается, но стоит его в два раза увеличить как все распознается на ура. По крайней мере так было в предыдущей версии.

     
     
  • 3.4, Анончик (?), 16:59, 02/07/2010 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Ну, есть ещё и Гуй к нему: http://symmetrica.net/cuneiform-linux/yagf-ru.html
     
     
  • 4.8, Vitto74 (ok), 17:50, 02/07/2010 [^] [^^] [^^^] [ответить]  
  • +1 +/
    >Ну, есть ещё и Гуй к нему: http://symmetrica.net/cuneiform-linux/yagf-ru.html

    К сожалению гуй не дотягивает. По крайней мере пока.

     
  • 3.28, аноним (?), 15:38, 03/07/2010 [^] [^^] [^^^] [ответить]  
  • +/
    А если тупо увеличить размер convert'ом?
     
  • 2.7, pavel_n (?), 17:48, 02/07/2010 [^] [^^] [^^^] [ответить]  
  • +/
    Пользовался виндовым Cuneiform с GUI-ём отсюда: http://www.cuneiform.ru,
    неплохо распознаёт, наверное как файнридер старых версий
     
  • 2.10, grayich (ok), 18:30, 02/07/2010 [^] [^^] [^^^] [ответить]  
  • +/
    По сравнению с FR он вообще распознавать не умеет. Пока слабо.
     
  • 2.29, аноним (?), 15:38, 03/07/2010 [^] [^^] [^^^] [ответить]  
  • +/
    Кое-где лучше, кое-где хуже. В целом на уровне.
     

  • 1.5, BirdGovorun (??), 17:24, 02/07/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Нормально распознаёт на уровне FineReader'а.
     
  • 1.6, Zenitur (?), 17:24, 02/07/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Ура! Наконец-то куниинформ первый вышел! Кто кстати его развивает теперь?
     
     
  • 2.16, igron (ok), 20:32, 02/07/2010 [^] [^^] [^^^] [ответить]  
  • –2 +/
    Каноникл и еще горстка разработчиков.
     
     
  • 3.49, Michael Shigorin (ok), 02:14, 06/07/2010 [^] [^^] [^^^] [ответить]  
  • +/
    Вторых местами знаю, а про первое слышу впервые.
     

  • 1.9, dimqua (ok), 18:28, 02/07/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Хорошая вещь, очень хорошо, что работает из консоли.
     
  • 1.12, samm (?), 19:28, 02/07/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    о, надо фревый порт обновить
     
     
  • 2.14, BirdGovorun (??), 20:03, 02/07/2010 [^] [^^] [^^^] [ответить]  
  • +/
    Нету в портах, пока нет.
     
     
  • 3.26, samm (?), 13:02, 03/07/2010 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Дык я мейнтейнер )))
     
     
  • 4.41, BirdGovorun (??), 18:58, 03/07/2010 [^] [^^] [^^^] [ответить]  
  • –3 +/
    Вы не поняли 1.0 нет, 0.8.0 есть, если вы мейнтейнер, где 1.0?
     
     
  • 5.50, Michael Shigorin (ok), 02:15, 06/07/2010 [^] [^^] [^^^] [ответить]  
  • +/
    >Вы не поняли 1.0 нет, 0.8.0 есть, если вы мейнтейнер, где 1.0?

    Если Вы юзер, то где обновлённый порт или на худой конец PR? :}

     
  • 3.30, аноним (?), 15:39, 03/07/2010 [^] [^^] [^^^] [ответить]  
  • +/
    Два года уже в портах и замечательно работает.
     

  • 1.13, yason (?), 19:37, 02/07/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Вот ещё бы не был он так завязан на гнутую libc... Тогда бы и в OpenBSD мог нормально работать.
     
     
  • 2.31, аноним (?), 15:40, 03/07/2010 [^] [^^] [^^^] [ответить]  
  • +/
    >Вот ещё бы не был он так завязан на гнутую libc... Тогда
    >бы и в OpenBSD мог нормально работать.

    Ну во FreeBSD-то он нормально работает, без гнутых либсей. Может в OpenBSD совсем куцая libc?

     
     
  • 3.34, yason (?), 16:22, 03/07/2010 [^] [^^] [^^^] [ответить]  
  • +/
    >>Вот ещё бы не был он так завязан на гнутую libc... Тогда
    >>бы и в OpenBSD мог нормально работать.
    >
    >Ну во FreeBSD-то он нормально работает, без гнутых либсей. Может в OpenBSD
    >совсем куцая libc?

    в ней нет malloc_usable_size, с остальным, вроде, ОК

     
     
  • 4.38, аноним (?), 17:09, 03/07/2010 [^] [^^] [^^^] [ответить]  
  • +/
    Хм, ну если cuneiform использует ее для чего-то отличного от статистики, надо его фиксить. Иначе можно заменить вызовы этой ереси на нули.
     
     
  • 5.39, PereresusNeVlezaetBuggy (ok), 17:13, 03/07/2010 [^] [^^] [^^^] [ответить]  
  • +/
    >Хм, ну если cuneiform использует ее для чего-то отличного от статистики, надо
    >его фиксить. Иначе можно заменить вызовы этой ереси на нули.

    Уже потихоньку пробую сделать порт...

     
     
  • 6.45, uliss (?), 11:53, 04/07/2010 [^] [^^] [^^^] [ответить]  
  • +/
    ветка lp:~serge-uliss/cuneiform-linux/refactoring компилируется под OpenBSD 4.6, но сегфолтится при запуске, из-за неразрешенных символов в библиотеках
     
  • 2.46, Ян Злобин (ok), 13:51, 04/07/2010 [^] [^^] [^^^] [ответить]  
  • +/
    >Вот ещё бы не был он так завязан на гнутую libc... Тогда бы и в OpenBSD мог нормально работать.

    Не завязан вроде:
    http://www.FreeBSD.org/cgi/ports.cgi?query=cuneiform-0.8.0&stype=all&sektion=

     

  • 1.15, KERNEL_PANIC (ok), 20:05, 02/07/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +8 +/
    Слава разработчикам! Вместо того, чтобы сделать 10000ый джабер-клиент или еще один бестолковый музплеер, они создали действительно НУЖНУЮ программу. Тем более, свободную. Мои почтения!!!
     
     
  • 2.17, Zenitur (?), 21:12, 02/07/2010 [^] [^^] [^^^] [ответить]  
  • +6 +/
    Этой программе с десяток лет. И изначально она не была свободной
     
     
  • 3.35, phil (??), 16:24, 03/07/2010 [^] [^^] [^^^] [ответить]  
  • +/
    Этой программе более 20 лет. Вначале называлась Tiger.
     

  • 1.18, Аноним (-), 21:24, 02/07/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    ИМХО. релиз ни о чем, просто поменяли версию либы, никаких улучшений, типа добавления новых языков, форматов экспорта и т.п. не было
    Библиотека слишком сыра, чтобы получить первую версию
     
     
  • 2.20, Zenitur (?), 23:08, 02/07/2010 [^] [^^] [^^^] [ответить]  
  • +5 +/
    Уверен, так и надо. Добавили функций, сделали версию 0.x. Отшлифовали - переименовали библотки и саму программу в 1.0.
    P.S. Что за глупое словосочетание "ни о чём", пришедшее из телевизора с комеди клабом и прочим тээнтэ.
     
     
  • 3.23, Аноним (-), 03:18, 03/07/2010 [^] [^^] [^^^] [ответить]  
  • +1 +/
    разница между 0.9 и 1.0 - в 22 коммита, можете сами посмотреть каких(((
     
     
  • 4.36, PereresusNeVlezaetBuggy (ok), 17:04, 03/07/2010 [^] [^^] [^^^] [ответить]  
  • +/
    >разница между 0.9 и 1.0 - в 22 коммита, можете сами посмотреть
    >каких(((

    Так и должно быть: значит, прога действительно стабильна (ну или совсем заброшена, но, вроде, это не тот случай). Куча коммитов непосредственно перед релизом свидетельствует в первую очередь о хреновом Q&A.

     
     
  • 5.40, Alexey (??), 18:34, 03/07/2010 [^] [^^] [^^^] [ответить]  
  • +/
    Просто программа очень сложная - поэтому людей реально что-то могущих усовершенствовать в распознавании можно найти только за денюжку.
     

  • 1.19, nico (??), 22:21, 02/07/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Работает, нужно пакеты собрать...
     
  • 1.21, Анонимиус (?), 23:45, 02/07/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Нечеткий машинописный текст оно не осилило. Впрочем, файнридер тоже. +(
     
     
  • 2.22, Mna (??), 02:11, 03/07/2010 [^] [^^] [^^^] [ответить]  
  • +/
    Если файнридер не осилил, то
    это наверное был не машинописный текст.
    а скажем рукописный печатными буквами

    а если кьЮнифОрм не осилил печатные буквы от руки,
    то это, наверное, не беда.

    :)

     

  • 1.24, Андрей (??), 07:53, 03/07/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Не поверите, я как-то начинал разрабаоывать OCR-прогу на PHP. Дальше начального алгоритма дело не пошло, но желание до сих пор осталось.
     
  • 1.25, Андрей (??), 08:31, 03/07/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • –1 +/
    Предлагаю заняться этим, и написать подобную прогу с нуля. Кто хочет, пишите сюда.
     
     
  • 2.27, анон (?), 13:29, 03/07/2010 [^] [^^] [^^^] [ответить]  
  • +1 +/
    русскую ос еще напиши
     
  • 2.33, аноним (?), 15:42, 03/07/2010 [^] [^^] [^^^] [ответить]  
  • +/
    >Предлагаю заняться этим, и написать подобную прогу с нуля. Кто хочет, пишите
    >сюда.

    Тебе на gamedev.ru

     
  • 2.37, PereresusNeVlezaetBuggy (ok), 17:07, 03/07/2010 [^] [^^] [^^^] [ответить]  
  • +3 +/
    >Предлагаю заняться этим, и написать подобную прогу с нуля. Кто хочет, пишите
    >сюда.

    А почему помочь существующему проекту не хочется? Время и силы девать некуда? Или не получилось осилить имеющийся код? Если да, то откуда уверенность, что свой будет лучше?

     

  • 1.44, svm (??), 08:37, 04/07/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Собрал deb пакеты Cuneiform 1.0:
    для i386
    http://dl.dropbox.com/u/8726620/cuneiform/i386/cuneiform_1.0.0%2Bdfsg-5_
    http://dl.dropbox.com/u/8726620/cuneiform/i386/cuneiform-common_1.0.0%2B

    для amd64
    http://dl.dropbox.com/u/8726620/cuneiform/amd64/cuneiform_1.0.0%2Bdfsg-5
    http://dl.dropbox.com/u/8726620/cuneiform/amd64/cuneiform-common_1.0.0%2

     
  • 1.47, VVV (??), 05:22, 05/07/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Здорово. Ещё гуй удобный, чтоб начинающие пользователи не пугались, и ещё одна большая проблема при переходе уйдёт.
     
     
  • 2.48, svm (??), 14:53, 05/07/2010 [^] [^^] [^^^] [ответить]  
  • +/
    >Ещё гуй удобный, чтоб начинающие пользователи не пугались

    Вот и гуй к нему:
    YAGF http://symmetrica.net/cuneiform-linux/yagf-ru.html

    deb пакеты
    http://notesalexp.org/lucid/main/y/yagf/yagf_0.8.1-2_amd64.deb]yagf_0.8.
    http://notesalexp.org/lucid/main/y/yagf/yagf_0.8.1-2_i386.deb]yagf_0.8.1

     

  • 1.51, Анон (?), 08:18, 09/07/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    А какие еще альтернативы по распознаванию есть в линуксе?
    Под венду cuneiform плох - работает только от админа и не распознает оттенки серого, только чб.
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру