Классификация объектов нечисловой природы на основе непараметрических оценок плотности

для любого Функция называется производной Родона-Никодима меры по мере , а в случае, когда - вероятностная мера, также плотностью вероятности по отношению к . " [5]

Будем считать, что в пространстве объектов нечисловой природы фиксирована некоторая мера , а мера соответствует распределению Р случайного элемента со знаниями в измеримом пространстве , т. е.

Если - пространство из конечного числа точек, то в качестве меры можно использовать считающую меру (приписывающую единичный вес каждой точке), т. е. , или

В случае считающей меры значение плотности в точке совпадает с вероятностью попасть в точку , т. е.

Многие методы классификации используют расстояния или меры близости между объектами или признаками. Такие методы пригодны и для классификации объектов нечисловой природы, лишь бы в соответствующем пространстве было определено расстояние или мера близости. Таким образом, широко известные иерархические агломеративные алгоритмы ближайшего соседа, дальнего соседа, средней связи и др., результатом работы которых являются дендрограммы, на самом деле относятся к статистике объектов нечисловой природы.

Не пытаясь рассмотреть все многообразие методов классификации в статистике объектов нечисловой природы (см., например, [6, 7]), сосредоточимся на тех из них, которые используют плотности распределения и их оценки. Зная плотности распределения классов, можно решать основные задачи классификации - как задачи выделения кластеров, так и задачи диагностики. В задачах кластер-анализа можно находить моды плотности и принимать их за центры кластеров или за начальные точки итерационных методов типа динамических сгущений. В задачах диагностики (дискриминации, распознавания образов с учителя) можно принимать решения о классификации объектов на основе отношения плотностей, соответствующих классам. При неизвестных плотностях представляется естественным использовать их состоятельные оценки. Корректность такой постановки, как правило, нетрудно обосновать, например, в стиле [8]. Таким образом, для переноса на пространства произвольной природы основных методов классификации рассматриваемого типа достаточно уметь оценивать плотность распределения вероятности в таких пространствах.

Перейти на страницу: 1 2 3 4 5 6

Дополнительно

Высокопроизводительная, экономичная и безопасная работа технологических агрегатов металлургической промышленности
Высокопроизводительная, экономичная и безопасная работа технологических агрегатов металлургической промышленности требует применения современных методов и средств измерения величин, характеризующих ход производственного процесса и состояние оборудования. Автоматический контроль является логически ...

Естественно-научные концепции развития микроэлектронных и лазерных технологий
Электроника - наука о взаимодействии электронов с электромагнитными полями и о методах создания электронных приборов и устройств (вакуумных, газоразрядных, полупроводниковых), используемых для передачи, обработки и хранения информации. Возникла она в начале ХХ века. На ее основе были созданы элект ...

Меню сайта