О компании |  ПартнерыЦены |  Семинары  | Библиотека  | Контакты
BIGroup Labs

 Поиск по сайту
 
  Главная страница |Решения |Технологии |Услуги |Продукция |Клиенты
  Главная страница   >      Технологии   >      DataMining   >    Распознавание образов

Knowledge Discovery in Databases
Data Mining
Data Mining-подготовка исходных данных
Ассоциативные правила
Деревья решений
Распознавание образов
Нечеткая Логика
Генетические Алгоритмы
Нейронные Сети

Распознавание образов

Распознавание образов включает в себя следующие дисциплины:

  • Информатика
  • Прикладная физика, необходима для разработки датчиков
  • Математика

Распознавание образов - совокупность методов и средств, позволяющих, по меньшей мере, достигнуть, а если возможно превзойти естественные средства восприятия и анализа окружающего мира живыми существами.

Задачи, решаемые при помощи этого научного направления:

  • Автоматическое чтение рукописного и машинописного текстов;
  • Восприятие техническими устройствами слитной речи независимо от диктора и особенностей языка;
  • Автоматизация медицинской диагностики;
  • Автоматический синхронный перевод с одного языка на другой;
  • Дистанционная индентификация объектов;
  • Дистанционное определение ориентации геометрических тел;
  • Интерпретация социологических данных;
  • Криминалистика и т.д.

Термин - восприятие подразумевает способность классифицировать и идентифицировать объекты наблюдения. Классом образов называется совокупность образов, обладающих некоторыми общими свойствами. Число признаков, характеризующих объект, может быть бесконечно большим, поэтому на практике выбирают их ограниченное количество. Одна и та же совокупность данных может быть организована различным образом, в зависимости от заранее намеченной конечной цели. Операцию предварительной обработки можно рассматривать как фильтрацию. Один и тот же набор данных может служить источником различных классификаций. Отыскание буквы в N-буквенном алфавите - задача с N классами, отыскать гласные и согласные в этом алфавите - задача с 2 классами.
Число классов может быть заранее неизвестным, тогда говорят об обучении "без учителя" (самообучении) в противном случае говорят об обучении "с учителем". Адаптация или обучение играет важнейшую роль в процессе распознавания.
Первоначальные знания, полученные в процессе обучения, играют важную роль в процессе распознавания. Известно, что конечное состояние системы сильно зависит от начальных условий.
Отсутствие начальных знаний (знаний эксперта в рассматриваемой области) чрезвычайно усложняет решение задачи.

Систему автоматической классификации можно разделить на четыре блока:

  1. Блок датчиков, характеристики этого узла определяют характеристики всей системы в целом;
  2. Блок предварительной обработки. Задача, решаемая этим узлом, состоит в выделении характерных признаков объекта. Сначала отделяется та область, в которой находится объект. Для этого аппаратными или программными средствами устраняются случайные искажения и сглаживаются шумы, для зрительных образов это обнаружение и сопровождение наблюдаемого объекта внутри окна наблюдения;
  3. Блок классификации, использующий методы теории решений или структурный (синтаксический/ лингвистический) метод;
  4. Блок памяти (контекста). Играет такую же роль, как и априорные знания получателя при оценке количества информации в сообщении и интерпритации его в процессе передачи по каналу связи.

Распознавание на основе методов теории решений

Сопоставление

Введя понятие расстояния между классами можно оценить степень сходства как между элементами класса, так и между классами.
Понятие расстояние между классами обладает двумя основными свойствами:
Компактность - точки, представляющие объекты одного класса, расположены ближе друг к другу, чем к точкам, представляющим объекты других классов.
Разделимость (сепарабельность), отражающее тот факт, что классы ограничены и не пересекаются между собой.
На практике оба эти свойства выполняются далеко не всегда, поскольку сильно зависят от того, насколько удачно выбраны признаки.
Для сопоставления используется так же корреляционный подход.

Вероятностный (байесовский) подход

Случайное событие - это такое, для которого невозможно предсказать его точный результат в каждом конкретном случае. Однако при большом числе реализаций эти события можно характеризовать средними результатами, стабильными и воспроизводимыми.
Условная вероятность (апостериорная) показывает вероятность наступления события A, при условии, что произошло событие B.
Решающее правило.
Пусть W- сеперабельное пространство признаков, а X- вектор, представляющий k-й класс. Вероятность P(X) считается заданной. Задача заключается в отнесении неизвестного объекта к одному из известных классов C. Для этого выполняется n измерений. В результате получаем вектор измерений Xизм. для которого можно найти условную вероятность (или ее плотность). Отнесение неизвестного объекта к классу с номером k можно считать оправданным, если произведение априорной вероятности известного класса C с номером k на апостериорную плотность вероятности Xизм. при рассмотрении класса C больше, или по крайней мере равно, произведению априорной вероятности любого номера j классов C из множества известных классов на апостериорную плотность вероятности Xизм. при рассмотрении класса C с номером j.
Процесс разделения на классы связан с определенным риском, которому можно придать определенную цену. Таким образом, классификация сводится к отысканию такого оптимального решающего правила, при котором минимизируется среднее значение цены.

Нейронные сети

Рассмотренные выше методы основывались на использовании выборки для оценивания статистических параметров каждого класса. Классификатор по минимуму расстояния полностью задается векторами математического ожидания всех классов. Аналогично вероятностный (байесовский) подход для нормально распределенных совокупностей оразов полностью определяется векторами математического ожидания и ковариационными матрицами каждого класса. Образы, принадлежащие к известным классам и используемые для оценивания упомянутых параметров, называются обучающими. В этих случаях обучающие образы каждого класса используются для вычисления параметров дискриминантной функции, соответствующей этому классу. После этого структура классификатора становится фиксированной, и его качество зависит лишь от того, насколько хорошо реальные совокупности образов отвечают статистическим предположениям.
В реальных условиях статистические свойства классов образов очень часто бывают неизвестны или не поддаются оценке. Поэтому на практике более эффективным оказываются методы, в которых необходимые дискриминантные функции строятся непосредственно в ходе обучения.

Нейронные сети, по своей сущности (см. подробнее), являются наиболее подходящим инструментом для классификации образов.

Структурные методы распознавания

Методы теории решений основываютя на количественных характеристиках объектов и по большей части игнорируют структурные связи, присущие форме объектов. Степень сходства формы границ двух областей определяется как наибольшее значение порядка, при котором их номера фигур еще совпадают. Расстояние между формами определяется как величина, обратная их степени сходства.....
Продолжение следует....

Климов Артем,
BIGroup Labs.

Библиотека | Партнеры | Семинары | Контакты | Карта сайта
© 2012, BIGroup Labs.    Лаборатория Интеллектуального Бизнеса - 2004г.