Системы оптического распознавания текстов.

Заказать уникальный доклад
Тип работы: Доклад
Предмет: Информационные технологии
  • 16 16 страниц
  • 5 + 5 источников
  • Добавлена 18.06.2019
748 руб.
  • Содержание
  • Часть работы
  • Список литературы
  • Вопросы/Ответы
ВВЕДЕНИЕ
1 ОБЩИЕ ПРЕДСТАВЛЕНИЯ О ТЕОРИИ РАСПОЗНАВАНИЯ СИМВОЛОВ

2 СУТЬ ПРОЦЕССА РАСПОЗНАВАНИЯ ТЕКСТА

3 ОСНОВНЫЕ ПРОГРАММЫ РАСПОЗНАВАНИЯ ТЕКСТА
4 СРАВНИТЕЛЬНЫЙ АНАЛИЗ ВОЗМОЖНОСТЕЙ СИСТЕМ РАСПОЗНАВАНИЯ СИМВОЛОВ

ЗАКЛЮЧЕНИЕ
Фрагмент для ознакомления

В ходе тестирования будут изучены функциональные возможности программ, их интерфейсы и — что самое важное — испытание программ на нескольких документах различной сложности для проверки распознавания.
Знакомство с любой программой начинается с интерфейса, ведь даже самая функциональная программа, с которой неудобно работать, утрачивает до половины своих пользователей. На рисунках 4.1 и 4.2 отображены интерфейсы сравниваемых программ.
Рассматриваемые программы отличаются весьма аскетичным интерфейсом, с минимальным набором элементов управления. В плане удобства работы интерфейсы можно также считать равнозначными. Единственный минус CuneiForm - дизайн в стиле Windows 98, что может не очень понравиться пользователям, привыкшим к намного более современным версиям операционной системы.


Рисунок 4.1- Главное окно Cuineform 12

Рисунок 4.2 - Главное окно FineReader 9.0
FineReader, развиваясь планомерно на протяжении последних нескольких лет, успел существенно обогнать конкурента. Возможностей CuneiForm будет больше чем достаточно для обычного рядового пользователя. Программа умеет открывать графические файлы, принимать изображения со сканера, производить автоматически разметку документа, распознавать таблицы и, конечно же, текст, форматировать распознанный документ в Word-подобном редакторе и экспортировать результаты своей работы в Word и Excel. Единственным существенным недостатком бесплатной версии программы является невозможность работы с документами в формате PDF.
Программа FineReader умеет работать с PDF (открывать для распознавания и сохранять), получать изображения с цифровых фотокамер, определять автоматически угол наклона распознаваемого документа и очищать изображение от мусора, сохранять результат работы в форматах последних версий Office (docx, xlsx), распознавать штрих-коды и работать на многоядерных процессорах (при соответствующем приросте производительности).
В качестве тестового задания были использованы несколько образцов различной степени сложности, но полная картинка открылась уже на самом простом тесте. Исходное задание было следующим: распознать сфотографированный на цифровую камеру лист формата А4, на котором размещался в два столбца текст, набранный шрифтом Times New Roman кегля 12pt в соответствии с рисунком 4.3. Задача была усложнена тем, что текст на изображении был повернут под углом около 3 градусов, из-за плохих условий съёмки был несколько размыт, кроме того, имелись оптические искажения, обусловленные тем, что лист при фотографировании был несущественно изогнут.
Для CuneiForm распознавание данного документа оказалось почти не разрешимой задачей. «Подумав» около пяти секунд, программа выдала результат, в котором было действительно правильно распознано меньше 10% слов. Остальное распознано было либо с ошибками, либо превратилось в нечитаемый мусор.
FineReader показал намного лучший результат: ни единой ошибки и около двух десятков «сомнительных» символов (практически все они оказались в итоге верными - программа просто перестраховывалась).


Рисунок 4.3 – Тестовый документ
Опыт был повторён после небольшой зачистки документа в графическом редакторе: вычищены шумы, увеличена резкость, текст расположен строго горизонтально (при этом символы были несколько искажены, так как разрешение изображения оставляло желать лучшего).
Данное вмешательство принесло свои плоды: CuneiForm увеличил количество правильно распознанных символов примерно до 20%. В случае с FineReader результат почти не изменился.
Таким образом, CuneiForm в настоящее время устарела и пригодна только для работы с идеально отсканированными документами с достаточно простой структурой.
Во множестве областей OpenSource ПО давно уже на равных конкурирует с коммерческими разработками, а кое-где даже постепенно вырывается вперёд. Однако в сфере OCR время массового распространения открытых программ ещё не настало. CuneiForm оправдывает только тот факт, что данная система находится на начальной стадии своего OpenSource-пути и у неё всё ещё впереди. А пока пользователям, которые желают получать гарантированный результат, рекомендуется продолжать пользоваться программой FineReader.

ЗАКЛЮЧЕНИЕ

Таким образом, следует сделать ряд выводов по рассмотренной теме.
С  точки зрения компьютера, документ после сканирования превращается в набор точек, а не в текстовый документ. Проблема распознавания текста в составе графического изображения достаточно сложна.
Если созданное сканером изображение содержит рисунки и текст, то путем применения специальной программы оптического распознавания текста (OCR) можно:
- отделить текст от рисунков;
- записать данный текст в формате файла текстового процессора.
Программное обеспечение в современных системах OCR выполняет анализ форм букв и создание текстового файла, в который распознаваемый текст посимвольно записывается с последовательным формированием слов и предложений.
Раньше распознавание текста было возможно лишь посредством сравнения обнаруженных конфигураций точек со стандартным образцом (эталоном, которые хранятся в памяти компьютера). Такие программы опирались на специально разработанные шрифты, облегчавшие данный подход. В последние годы исследователи разрабатывают совершенно новые алгоритмы распознавания образов и программы, построенные на данных алгоритмах, могут справляться с текстом, не ориентируясь на определенный алфавит или шрифт, в том числе текст может быть и рукописным.
Наиболее широко распространены и известны программы оптического распознавания текстов отечественных производителей FineReader и CuneiForm.

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

Безручко В. Т. Информатика: курс лекций: Учебное пособие. - М.: ИД. Форум, 2016.-432 с.
Гвоздева В. А. Информатика, автоматизированные информационные технологии и системы: учебник / В. А. Гвоздева. – М: Форум: Инфра-М, 2015. – 541 с.
Информатика. Базовый курс: учебное пособие для высших технических учебных заведений /С. В. Симонович и др.. – СПб: Питер, 2014. – 639 с.
Олифер В.Г. Компьютерные системы. Принципы, технологии, протоколы: Учебник для вузов. Стандарт третьего поколения / В.Г. Олифер, Н.А. Олифер. - СПб.: Питер, 2015. - 944 c.
Федотова Е.Л. Информационные технологии и системы: Учебное пособие. - М.: Форум, 2016. - 352 с.

Олифер В.Г. Компьютерные системы. Принципы, технологии, протоколы: Учебник для вузов. Стандарт третьего поколения / В.Г. Олифер, Н.А. Олифер. - СПб.: Питер, 2015. – С. 396.
Федотова Е.Л. Информационные технологии и системы: Учебное пособие. - М.: Форум, 2016. – С. 131.
Гвоздева В. А. Информатика, автоматизированные информационные технологии и системы: учебник / В. А. Гвоздева. – М: Форум: Инфра-М, 2015. – С. 258.
Безручко В. Т. Информатика: курс лекций: Учебное пособие. - М.: ИД. Форум, 2016.-С. 219-223.
Информатика. Базовый курс: учебное пособие для высших технических учебных заведений /С. В. Симонович и др.. – СПб: Питер, 2014. – С. 452.











2





1

1. Безручко В. Т. Информатика: курс лекций: Учебное пособие. - М.: ИД. Форум, 2016.-432 с.
2. Гвоздева В. А. Информатика, автоматизированные информаци-онные технологии и системы: учебник / В. А. Гвоздева. – М: Форум: Ин-фра-М, 2015. – 541 с.
3. Информатика. Базовый курс: учебное пособие для высших тех-нических учебных заведений /С. В. Симонович и др.. – СПб: Питер, 2014. – 639 с.
4. Олифер В.Г. Компьютерные системы. Принципы, технологии, протоколы: Учебник для вузов. Стандарт третьего поколения / В.Г. Оли-фер, Н.А. Олифер. - СПб.: Питер, 2015. - 944 c.
5. Федотова Е.Л. Информационные технологии и системы: Учебное пособие. - М.: Форум, 2016. - 352 с.

Вопрос-ответ:

Какие основные принципы лежат в основе систем оптического распознавания текстов?

Основными принципами систем оптического распознавания текстов являются анализ формы символов, преобразование изображения в цифровую форму и применение алгоритмов сопоставления для определения распознаваемых символов.

Как происходит процесс распознавания текста в системах оптического распознавания?

Процесс распознавания текста в системах оптического распознавания включает в себя считывание изображения текста, преобразование его в цифровую форму, сегментацию на отдельные символы, а затем применение алгоритмов распознавания для определения символов и их последующей классификации.

Какие основные программы используются в системах оптического распознавания текстов?

Основными программами, используемыми в системах оптического распознавания текстов, являются программы для предварительной обработки изображений, программы для сегментации и классификации символов, а также программы для исправления ошибок распознавания и постобработки текста.

Какие возможности имеют системы оптического распознавания символов?

Системы оптического распознавания символов имеют возможность распознавать символы различных шрифтов и размеров, а также учитывать различные искажения и шумы на изображении текста. Они также могут корректировать ошибки распознавания и выполнять постобработку распознанного текста.

Как проходит тестирование систем распознавания символов?

Тестирование систем распознавания символов включает изучение их функциональных возможностей, анализ интерфейсов программ и проведение испытаний на реальных документах различной сложности для проверки точности распознавания.

Какие основные принципы лежат в основе теории распознавания символов?

Основные принципы теории распознавания символов включают в себя использование математических моделей для описания форм символов, алгоритмы обработки изображений и анализа текста, а также методы классификации символов.

Что представляет собой процесс распознавания текста?

Процесс распознавания текста включает в себя обработку изображения с помощью оптического сканера или камеры, преобразование изображения в текстовый формат и анализ полученного текста.

Какие программы используются для распознавания текста?

Для распознавания текста используются различные программы, например, OCR (Optical Character Recognition) программы, которые специализируются именно на распознавании символов на изображениях и преобразовании их в текстовый формат.

Какие функциональные возможности имеют программы распознавания символов?

Программы распознавания символов имеют различные функциональные возможности, включая распознавание текста на изображениях разной сложности, поддержку разных языков, возможность настройки параметров распознавания и многие другие.

Как проводится тестирование программ распознавания текста?

В ходе тестирования программ распознавания текста проводится изучение их функциональных возможностей, анализ интерфейса программы и проверка распознавания на нескольких документах разной сложности.

Какие основные принципы лежат в основе систем оптического распознавания текстов?

Основными принципами систем оптического распознавания текстов являются распознавание и классификация символов, а также анализ структуры текста.