Распознавание+символов

Структурно-пятенный эталон (фонтанное преобразование)
Структурно-пятенный эталон или фонтанное преобразование совмещает в себе достоинства шаблонной и структурной систем и, тем самым, позволяет избежать недостатков, присущих каждой из них по отдельности. Данный подход был разработан российской кампанией БИТ(BIT Software, ныне [|ABBYY]) для решения задачи [|распознавания печатного текста] и с успехом реализован в программе [|FineReader]. В основе этой технологии лежит использование структурно-пятенного эталона. Он позволяет представить изображения в виде набора пятен, связанных между собой n-арными отношениями, задающими структуру символа. Эти отношения (то есть расположение пятен друг относительно друга) образуют структурные элементы, составляющие символ. Так, например, отрезок - это один тип n-арных отношений между пятнами, эллипс - другой, дуга - третий. Другие отношения задают пространственное расположение образующих символ элементов. В эталоне задаются: - имя; - обязательные, запрещающие и необязательные структурные элементы; - отношения между структурными элементами; - отношения, связывающие структурные элементы с описывающим прямоугольником символа; - атрибуты, используемые для выделения структурных элементов; - атрибуты, используемые для проверки отношений между элементами; - атрибуты, используемые для оценки качества элементов и отношений; - позиция, с которой начинается выделение элемента (отношения локализации элементов). Структурные элементы, выделяемые для класса изображений, могут быть исходными и составными. Исходные структурные элементы - это пятна, составные - отрезок, дуга, кольцо, точка. В качестве составных структурных элементов, в принципе, могут быть взяты любые объекты, описанные в эталоне. Кроме того, они могут быть описаны как через исходные, так и через другие составные структурные элементы. В качестве отношений используются связи между структурными элементами, которые определяются либо метрическими характеристиками этих элементов (например, <длина больше>), либо их взаимным расположением на изображении (например, <правее>,<соприкасается>). При задании структурных элементов и отношений используются конкретизирующие параметры, позволяющие доопределить структурный элемент или отношение при использовании этого элемента в эталоне конкретного класса. Для структурных элементов конкретизирующими могут являться, например, параметры, задающие диапазон допустимой ориентации отрезка, а для отношений - параметры, задающие предельное допустимое расстояние между характерными точками структурных элементов в отношении <соприкасается>. Конкретизирующие параметры используются также для вычисления <качества> конкретного структурного элемента изображения и <качества> выполнения данного отношения. Построение и тестирование структурно-пятенных эталонов для классов распознаваемых объектов - процесс сложный и трудоемкий. База изображений, которая используется для отладки описаний, должна содержать примеры хороших и плохих (предельно допустимых) изображений для каждой графемы, а изображения базы разделяются на обучающее и контрольное множества. Разработчик описания предварительно задает набор структурных элементов (разбиение на пятна) и отношения между ними. Система обучения по базе изображений автоматически вычисляет параметры элементов и отношений. Полученный эталон проверяется и корректируется по контрольной выборке изображений данной графемы. По контрольной же выборке проверяется результат распознавания, то есть оценивается качество подтверждения гипотез. Распознавание с использованием структурно-пятенного эталона происходит следующим образом. Эталон накладывается на изображение, и отношения между выделенными на изображении пятнами сравниваются с отношениями пятен в эталоне. Если выделенные на изображении пятна и отношения между ними удовлетворяют эталону некоторого символа, то данный символ добавляется в список гипотез о результате распознавания входного изображения.


 * Программы для распознавания текста, использующие структурно-пятенный эталон: **

ABBYY FineReader – программа для распознавания текста, позволяет быстро и точно переводить изображения документов и PDF-файлы в электронные редактируемые форматы без необходимости перепечатывания.[| http://www.abbyy.ru/finereader/]

OCR CUNEIFORM - это система оптического распознавания ведущего российского разработчика программного обеспечения Cognitive Technologies. OCR CuneiForm обеспечивает быстрое и высококачественное преобразование бумажных документов и электронных графических файлов в редактируемый текст для последующей работы с ним. []

1. [] 2. [|http://www.mari-el.ru/mmlab/home/AI/11/index.html#part_3]
 * Источники: **