Статьи
15.06.2017

Сканирование и распознавание документов

Сканирование и распознавание документовЕще недавно при попытке обработать документ с помощью сканера, получался графический образ, который никак нельзя было отнести к текстовому варианту — это был набор разноцветных точек. Задача распознавания текста была одной из самых сложных и для ее решения использовались специальные программы, способные трансформировать образы в буквенное выражение. Но только в последнее время был совершен основательный прорыв в этом вопросе – был задан основной критерий «похожести», который использовался при идентификации символов. Таким образом, качественное сканирование и распознавание документов стало реальным. Изначально можно было работать только с исходным материалом, в котором применен специальный шрифт, а на сложных вариантах происходил сбой.

Поиск решений

Но процесс не стоял на месте – авторы дорабатывали старые программы и писали новые. В результате полученный продукт перевернул существовавшее представление – он оказался способным решать задачи любой степени сложности, распознавать самые сложные шрифты и даже рукописные варианты. При этом нет необходимости делать всякие перенастройки.

В результате можно получить:

  • высокую степень точности;
  • оперативность.

Сканирование и распознавание документовА число программ, которые разрабатывались разными специалистами параллельно друг с другом, росло. Они были с разным исходным алгоритмом, что, в конечном счете, давало непохожие результаты. Одни программы действительно были универсальными, другие способными трансформировать в буквы отсканированный текст, написанный каким-то одним шрифтом при использовании определенного кегля. И все же многие могут распознавать написанное даже на нескольких языках. Сейчас распознавание документов перестало быть проблемой.



Предыдущая статья


К списку статей
© ООО "Ру-скан", 2011.