Выпущен новый релиз свободной системы распознавания печатных текстов Cuneiform, построенной на базе открытых компанией Cognitive Technologies исходных текстов. В новой версии появилась поддержка вывода в формате hOCR, который например можно без труда сконвертировать в PDF. В прошлом релизе была добавлена поддержка вывода в формате RTF, добавлена поддержка платформы FreeBSD.
OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи. Поддерживается более чем 20 языков. Отдельно стоит отметить отличную поддержку распознавания текста на русском и украинском языках. Результат распознавания может быть сохранен в HTML формате с сохранением особенностей начертания оригинала (выделение жирным, курсивом и т.д.).
|