Всё большему числу пользователей рекомендуют купить тот или иной смартфон из-за...
Возможности CuneiForm :
При распознавании сохраняется структура документа и его форматирование.
Распознает таблицы любой структуры и сложности, в том числе и без отображения линий табличной сетки.
Распознаются любые печатные шрифты: книги, газеты, журналы, распечатки с лазерных и матричных принтеров, тексты с пишущих машинок и т.п.
Алгоритмы оптического распознавания (OCR, Optical Character Recognition), встроенные в программу позволяют распознавать текст с матричного принтера, плохих ксерокопий и факсов.
Распознавание документов более чем на 20 языках: на русском, английском, украинском, немецком, французском, испанском, итальянском, и других.
Для повышения качества распознавания в программе используется словарная проверка. При этом стандартный словарь можно расширить за счет импорта новых слов из текстовых файлов.
Для координации работы над проектом действует сайт OpenOCR.org c русскоязычным форумом .
Статус программы: Бесплатная
Операционка: Windows 7, Vista, XP
Интерфейс: Английский, Русский
Разработчик: Cognitive Technologies
Размер: 33.3 Mb
СКАЧАТЬ OCR CuneiForm V.12
СКАЧАТЬ Cognitive OpenOCR (Russian)
СКАЧАТЬ Cognitive OpenOCR (English)
Небольшой мануал по работе:
После установки у Вас появятся два ярлыка:
Пакетное распознование - обработка целых папок.
CuneiForm - обработка документов со сканера или отдельных файлов.
Запускаем программу. На мой взгляд большинству подойдёт второй вариант запуска программы. В открывшемся окне выбираем значок с волшебной палочкой (стрелка).
Открывается окно "мастера распознования". Выбираем источник исходного файла (винчестер или сканер). Для примера я выбрал файл на жеском диске.
Жмём "Далее". Открывается страница выбора языка, где мы выбираем (естественно) язык (стрелка 1) и символ которым будут заменятся нераспознанные буквы (стрелка 2).
Опять "Далее". Выбираем параметры распозноваемого текста. Так как, у меня был отсканированный рукописный текст, я выбрал "Словарный контроль" и "Факс".
И т.к. исходный текст не содержал таблиц и картинок, убрал соответствующие точки на следующем пункте настройки.
Опять "Далее". И программа начала обработку текста.
Вот итог. Исходный фрагмент и после обработки программой.
Это итоги обработки рукописного фрагмента.
А вот итоги обработки отсканированного машинописного текста (параметры исходника выставлены такими же) :
Как видим результат напрямую зависит от исходника. При обработке рукописного теста, плохого качества целесообразней набирать его сразу вручную, чем обрабатывать программой и после править.
Поэтому не стоит надеяться на чудо. После распознования текста предстоит довольно кропотливая работа по исправлению ошибок .
Подготовлено по материалам computer-vsem.ru, cognitiveforms.com, softportal.com
Компиляция текста и ссылки
Итак, установка. В Убунте кстати доступна версия 0.7 из репозитариев. Версия 0.9 является последней на данный момент.
wget http://launchpad.net/cuneiform-linux/0.9/cuneiform-linux-0.9/+download/cuneiform-linux-0.9.0.tar.bz2
tar xvjf cuneiform-linux-0.9.0.tar.bz2
cd cuneiform-linux-0.9.0
mkdir builddir
cd builddir
cmake -DCMAKE_BUILD_TYPE=debug ..
make
make install
Дополнительный аргумент "-DCMAKE_INSTALL_PREFIX=/your/dir" установит cuneiform в нужную директорию.
Запускать можно со следующими аргрументами:
L
Указывает язык документа. Из возможных: eng(по умолчанию) ger fra rus swe spa ita ruseng ukr srp hrv pol dan por dut cze rum hun bul slo lav lit est tur.
O
Сохраняет в файл.
F
Формат полученного текста. Из поддерживаемых: text(по умолчанию), html, rtf, smarttext(plain text with TeX paragraphs), hocr(hOCR HTML format), native(Cuneiform 2000 format)
Dotmatrix
Оптимизация работы скрипта под изображение, распечатанное с помощью матричного принтера.
Fax
Оптимизация работы скрипта под изображение, распечатанное с помощью факса.
Singlecolumn
Отключает анализ страницы и подразумевает, что у нас изображение состоит из одной колонки текста.
Пример использования:
cuneiform -l ruseng -o /our/dir/text.txt /our/dir/book_1.tif
GUI
Далее захотелось уже графический интерфейс под бытовые нужды. Есть 2 штуки на выбор - это YAGF и :Было решено пользовать YAGF. Он тоже написан на qt и требует еще пакет проверки орфографии aspell . Скачиваем, устанавливаем.
OCR CuneiForm сможет отсканировать и мгновенно распознать бумажную документацию по технологии Optical Character Recognition в редактируемые текстовые и табличные форматы, совместимые с Microsoft Office Word и Excel. Потом материалы лучше сохранить и редактировать в офисных пакетах, текстовых и табличных редакторах, аналогах Microsoft Word и Microsoft Excel. Программа распространяется "как есть", разработчики не несут ответственности в связи с возможными проблемами и могут отменить действие свободной лицензии для следующих версий, поэтому стоит поторопиться и последнюю версию OCR CuneiForm скачать бесплатно для Windows 10, 8.1, 8, 7, Vista, XP, Linux или Mac OS X. Экономить время с КьюниФорм разработчики предлагают по принципу: чем лучше отсканировать и распознать, тем быстрее исправить и получить готовый результат.
Применение в CuneiForm новых технологических достижений
В начале XXI века считалось, что нормально работающей альтернативы ABBYY FineReader не существует. Несмотря на существование различных программ для OCR распознавания текста, ABBYY FineReader прочно оставался в лидерах индустрии сканирования и оцифровки документов. Это продолжалось до тех пор, пока самые продвинутые пользователи не попробовали для полноценного распознавания сфотографированного или сканированного текста скачать OCR CuneiForm 12 бесплатно без регистрации и SMS и протестировать потенциал этой по-настоящему бесплатной проги для Виндовс. При этом оказалось, что возможности OCR CuneiForm не уступают ABBYY FineReader ни в чем.
OCR CuneiForm умеет мгновенно идентифицировать все стандартные символы всевозможных начертаний и шрифтового исполнения. Распознаванию поддаются книги, журналы, листовки, газетки, принт-листы, факсовые рассылки, неудачные ксероксные копии, тексты с древних пишущих машинок и прочее, исключая декоративный шрифт и рукопись. В программном коде CuneiForm применяется ряд уникальных инновационных технологий Optical Character Recognition, таких как: адаптивное распознавание с применением шрифтонезависимых инструкций, нейронно-аналитические сети нормализации, когнитивная аналитика альтернативных вариантов трактовки текста, спецалгоритмы для матричного принтера, некачественных результатов ксерокопирования, факсов и машинописных страниц и прочие. При необходимости использовать все это для дела всегда можно бесплатно скачать CuneiForm для Windows 10, 8.. CuneiForm способен воссоздать абсолютную копию исходника. Сохраняется форматирование и структурирование, отступы, колонтитулы, сноски, индексы, количество и размеры колонок, абзацы, расположение отдельных фрагментов текста, табличных элементов и иллюстраций, стили шрифтов и другие элементы шрифтового оформления.
Интерфейс, языки, словари и функционал ОСР КьюниФорм
OCR CuneiForm отлично узнает и оцифровывает документацию, удобна в работе и не создает проблем начинающим пользователям, поскольку обладает удобным русскоязычным интерфейсом, имеет встроенные советы и всплывающие подсказки. Для закачки и подключения доступны популярные графические интерфейсы для КьюниФорм: YAGF, OCR Feeder, CF-Qt, Puma и прочие. Стандартный графический интерфейс имеет все инструменты, необходимые для полноценного распознания сканированного или сфотографированного текста. Мультиязычный интерфейс на родном языке способствует ускорению понимания оператором принципов работы и расширению спектра используемых возможностей. В настройках доступно конфигурирование под распознавание символов на русском, инглише, русско-английском и еще 20-ти европейских языковых раскладках. Качество мгновенного распознавания повышается при использовании словарей, которые можно расширять, импортируя слова из словарных файлов.
Основные функциональные преимущества программы OCR CuneiForm:
- достойное OCR распознавание и скорость работы,
- автоподбор оптимальных настроек сканирования,
- импорт отсканированных, сфотографированных или принятых иным путем картинок,
- поворот, переворот, инверсия, очистка и прочее редактирование изображений,
- несколько вариантов идентификации абзацев текста, таблиц и картинок,
- в работу идет любой материал, исключая декор и рукопись,
- словарная поддержка для улучшения качества,
- сравнительная демонстрация исходников и символьных результатов,
- OCR-совместимость со свыше двадцати языками, включая русский.
Бесплатность, множество преимуществ, скорость и отсутствие проблем в работе являются весомыми аргументами, чтобы скачать CuneiForm бесплатно на сайте сайт русскую версию. Использование высокотехнологичного гарантирует высококачественные скан и распознавание документации с бумажных носителей или растровых файлов в форматы, подходящие для редактирования в соответствующих редакторах.
Немного исторических фактов
Cognitive Technologies образовалась в 1993 г. на основе главного центра ИИ ИСА Российской Академии Наук. Как итог научно-практических исследований появилась первая CuneiForm. В конце 1993 года был подписан OEM-контракт с Corel Corporation, по которому код КьюниФорм вошел в пакет Corel Draw. В дальнейшем после многих лет перерыва компания освободила проект, перестав продавать и поддерживать программу, но программа КьюниФорм настолько хороша, что сегодня отсканировать и распознать русский текст лучше и дешевле всего получится, если бесплатно скачать OCR CuneiForm русскую версию на свой компьютер.
Вскоре этот программный продукт оказался одним из наиболее востребованных средств оптического распознавания текстов и заслужил позитивные отзывы и комментарии пользователей на официальном сайте cognitiveforms в домене com, тематических сайтах и форумах, а также в социальных сетях. Сегодня CuneiForm выделяется из массы прочего Optical Character Recognition программного обеспечения достойным распознаванием некачественной документации. Среди достоинств КуниФорма отмечены качественный перевод в цифровой вид бумажной документации и растровых файлов с экспортом в мультиформатный текст и таблицы Microsoft Office Word и Excel или их аналоги.
Ошибка во взаимодействии со сканерами
Сканирование на HP, Epson, Mustek, Canon и некоторых других черевато ошибкой. Причина данной проблемы обусловлена нюансами взаимодействия TWAIN-интерфейса с оборудованием. Лечится проблема простым редактированием строки с содержимым TWAIN_TransferMode в файле C:\Windows\face.ini до состояния: TWAIN_TransferMode=memory-native и перезапуском программы. Как правило, сегодня таких проблем не наблюдается, и чтобы получить из бумажного документа редактируемую электронную версию, нужно просто бесплатно скачать CuneiForm на русском языке с этой страницы сайта сайт без регистрации и СМС и использовать ее по прямому назначению. Это сбережет время и освободит от ручного набирания текста в Microsoft Word и таблиц в Microsoft Excel или аналогах этого ПО.
Последнюю версию CuneiForm 12 скачать бесплатно на русском языке
Бесплатные программы скачать бесплатно
Сейчас Вы находитесь на странице с названием "OCR КьюниФорм для полноценного распознавания сфотографированного или сканированного текста" сайта , где каждый имеет возможность легально скачать программы для компьютера с Microsoft Windows. Эта страница создана/существенно обновлена 06.06.2019. Спасибо, что посетили раздел .
Рано или поздно, все кто часто работает с офисными программами, сталкиваются с типичной задачей - отсканировать текст с книги, журнала, газеты, просто листочков, а затем перевести эти картинки в текстовый формат, например, в документ Word.
Чтобы это сделать необходим сканер и специальная программа для распознавания текста. В этой статье пойдет речь о бесплатном аналоге FineReader - CuneiForm (о распознавании в FineReader - ).
1. Особенности программы CuneiForm, возможности
Скачать можно с сайта разработчика: http://cognitiveforms.com/
Программа для распознавания текста с открытым исходным кодом. К тому же, работает во всех версиях Windows: XP, Vista, 7, 8, что радует. Плюс к этому добавьте полный русский перевод программы!
Плюсы:
Распознавание текста на 20 самых популярных языках мира (английский и русский само собой входит в это число);
Огромная поддержка различных печатных шрифтов;
Проверка по словарю распознанного текста;
Возможность сохранения результаты работы в нескольких вариантах;
Сохранение структуры документа;
Отличная поддержка и распознавание таблиц.
Минусы:
Не поддерживает слишком большие документы и файлы (более 400 dpi);
Не поддерживает на прямую некоторые типы сканеров (ну это не страшно, в комплект к драйверам сканера идет и спец. программа для сканирования);
Дизайн не блещет (но кому он нужен, если программа в полной мере решит задачу).
2. Пример распознавания текста
1) Открываем требуемую картинку в программе CuineForm (файл/открыть или «Cntrl+O «).
2) Чтобы приступить к распознаванию - нужно сначала выделить различные области: текста, картинок, таблиц и пр. В программе Cuneiform это можно сделать не только в ручную, но и автоматически ! Для этого щелкните по кнопке «разметка » в верхней панели окна.
3) Спустя 10-15 сек. программа автоматически подсветит все области различными цветами. Например, область текста выделяется синим цветом. Кстати, подсветила она все области правильно и довольно быстро. Честно говоря, не ожидал от нее такой быстрой и правильной реакции…
4) Для тех, кто не доверяет автоматической разметке, можно воспользоваться и ручной. Для этого есть панелька инструментов (см. картинку ниже), благодаря которой можно выделить: текст, таблицу, картинку. Передвинуть, увеличить/уменьшить начальное изображение, подрезать края. В общем, неплохой набор.
5) После того, как все области были размечены, можно приступить к распознаванию . Для этого просто щелкните по одноименной кнопке, как на картинке ниже.
6) Буквально через 10-20 сек. перед вами откроется документ в Microsoft Word с распознанным текстом. Что интересно, в тексте для этого примера, ошибки, конечно были, но их крайне не много! Тем более, учитывая в каком невзрачном качестве был исходный материал - картинка.
По скорости и качеству вполне сравнимо с FineReader!
3. Пакетное распознавание текста
Эта функция программы может пригодится, когда вам нужно распознать не одну картинку, а сразу несколько. Ярлык для запуска пакетного распознавания, обычно, спрятан в меню «пуск «.
1) После открытия программы, вам нужно создать новый пакет, либо открыть ранее сохраненный. В нашем примере - создадим новый.
2) В следующем шаге даем ему название, желательно такое, чтобы и через полгода вспомнить что в нем сохранено.
4) Теперь нужно указать папку, в которой расположены файлы для распознавания. Кстати, что интересно, программа сама найдет все картинки и другие графические файлы, которые она сможет распознать и добавить их в проект. Вам же останется удалить лишние.
5) Следующий шаг не важен- выбираете что делать с исходными файлами, после распознавания. Рекомендую выбрать галочку «ничего не делать».
6) Осталось лишь выбрать формат, в котором будет сохранен распознанный документ. Есть несколько вариантов:
- rtf - файл из документа word, открывается всеми популярными офисами (в том числе и бесплатными, );
- txt - текстовый формат, в нем можно сохранить только текст, картинки и таблицы нельзя;
- htm - гипертекстовая страничка, удобно, если вы сканируете и распознаете файлы для сайта. Его и выберем в нашем примере.
С другой стороны, есть у нее и минусы.
Во-первых, слишком мало инструментов для редактирования и проверки получившегося результата. Во-вторых, когда приходится распознавать много картинок - то в FineReader удобнее сразу видеть в колонке справа всё, что добавлено в проект: быстро удалять лишнее, вносить правки пр. И третье, на документах совсем уж плохого качества, CuneiForm проигрывает в качестве распознавания: приходится документ доводить до ума - править шибки, проставлять знаки препинания, кавычки и т.д.
На этом все. А вы знаете какую-нибудь еще достойную бесплатную программу для распознавания текста?
Название программы : OCR CuneiForm
Версия : 12
Размер : 33,4 Мб
Язык : несколько языков в т.ч. русский
Тип программы : распознавание текста
Лицензия : свободная с открытым кодом
Описание программы
OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи.
OCR CuneiForm это:
- высокое качество распознавания;
- высокая скорость работы;
- распознавание текстов на русском, английском, смешанном русско-английском, украинском, немецком, французском, испанском, итальянском, шведском и других (всего более 20);
- работа в режиме автофрагментации для поиска текстовых блоков, таблиц и изображений, а также мощное средство ручной и полуавтоматической фрагментации;
- распознавание таблиц любой структуры и сложности, в том числе и без отображения линий табличной сетки;
- автоматическое сохранение иллюстраций (черно-белых и цветных) и таблиц в получаемом на выходе документе;
- полное сохранение топологии страницы;
- поддержка пакетного режима сканирования и распознавания;
- простота использования и интуитивный интерфейс, встроенные помощники по работе с программой;
- встроенный текстовый редактор для работы с распознанным текстом;
- совмещенный показ изображений и результатов распознавания.
В системе используется целый ряд уникальных технологий, среди которых адаптивное распознавание, нейронные сети, когнитивный анализ альтернатив распознавания и другие.
Вопросы и ответы по программе
Что такое CuneiForm? CuneiForm - это система оптического распознавания крупнейшего российского разработчика программного обеспечения Cognitive Technologies, которая обеспечивает быстрое и высококачественное преобразование бумажных документов и электронных графических файлов, получаемых, например, со сканера или факса, в редактируемый текст для последующей работы с ним в текстовых редакторах.
Для кого предназначена OCR CuneiForm? Система распознавания текстов CuneiForm предназначена для всех, кому приходится вводить в компьютер факсы, книги, газеты, машинописные страницы, тексты договоров и т.д. Для работы с системой достаточно положить страницу с текстом в сканер, нажать кнопку, и через несколько секунд Вы получите готовый результат в многофункциональном текстовом редакторе.
Какие шрифты распознает OCR CuneiForm, требуется ли обучение? CuneiForm - шрифтонезависимая (OmniFont) система. Алгоритмы, заложенные в CuneiForm, исходят из правил написания букв, из их топологии, и не требуют задания каких-либо эталонов, или обучения.
В системе используется технология интеллектуального самообучения на базе адаптивного распознавания символов.
Распознаются любые печатные шрифты - книги, газеты, журналы, распечатки с лазерных и матричных принтеров, тексты с пишущих машинок и т.п.
Не распознается рукописный текст и декоративные шрифты (готический, стилизованный под рукописный).
В CuneiForm существуют специальные настройки для распознавания текстов с матричного принтера и факсов 200x100 dpi.
Чем OCR CuneiForm отличается от других подобных программ?
- качеством распознавания;
- высокой скоростью работы;
- использованием уникальных технологий, таких как адаптивное распознавание, нейронные сети, когнитивный анализ альтернатив распознавания и других;
- простой использования и интуитивным интерфейсом;
- функциональным наполнением, наличием многих дополнительных возможностей.
Поддерживает ли OCR CuneiForm работу с таблицами? Да. Программа автоматически находит в тексте таблицы различной структуры, в том числе без линий разграфки. Встроенный редактор поддерживает редактирование таблиц (можно уменьшать/увеличивать, удалять/создавать колонки и т.д.)
Как OCR CuneiForm отнесется к картинкам в тексте? Как пожелаете. Может просто проигнорировать их присутствие, а может сохранить в выходном документе в черно-белом, сером или цветном виде, в зависимости от вашего желания.
Ссылки для загрузки
- Скачать установочную версию с depositfiles.
Информация взята с официального сайта программы