Классификация объектов нечисловой природы на основе непараметрических оценок плотности

В СССР в середине 70-х годов активно ведутся работы по статистическому анализу нечисловых данных [1]. В настоящее время во Всесоюзном центре статистических методов и информатики мы при разработке методических документов и программных продуктов по прикладной статистике делим ее на четыре части соответственно виду обрабатываемых статистических данных: на статистику случайных величин, многомерный статистический анализ, статистику временных рядов и случайных процессов, статистику объектов нечисловой природы (другими словами, статистику нечисловых данных).

Вероятностный и статистический анализ нечисловых данных сопровождали теорию вероятностей и математическую статистику с самого начала их развития. Типичными примерами являются урновые схемы и изучение рождаемости. Испытание Бернулли- вероятностная модель простейшего объекта нечисловой природы. Наиболее массовым применением статистических методов является, видимо, выборочный контроль качества продукции по альтернативному признаку (т. е. по признаку "годен” - “не годен"), относящийся, очевидно, к статистике объектов нечисловой природы [2].

Развитие прикладных исследований привело к необходимости рассмотрения в качестве статистических данных различных объектов нечисловой природы. Этот термин применяем к объектам, которые нецелесообразно рассматривать как описанные числами. Другими словами, речь идет об элементах пространства, не являющихся линейными (векторными). Примеры: бинарные отношения (ранжировки, разбиения, толерантности и т. д.); множества; нечеткие множества; результаты измерений в шкалах, отличной от абсолютной; как обобщение перечисленных объектов - элементы пространств общей природы. Для результатов наблюдений, являющихся объектами нечисловой природы, рассматривают [1] классические задачи статистики: описание данных (включая классификацию) оценивание (параметров, характеристик, плотности распределения, регрессионной зависимости и т. д.).

Математический аппарат статистики объектов нечисловой природы основан не на свойстве линейности пространства, а на применении симметрик и метрик в нем, поэтому существенно отличается от классического.

В прикладных работах наиболее распространенный пример объектов нечисловой природы - разнотипные данные. В этом случае реальный объект описывается вектором, часть координат которого - значения количественных признаков, а часть - качественных (номинальных и порядковых).

Основная цель настоящего раздела - обосновать новый подход [3] к классификации в пространствах произвольной природы, основанный на построении не параметрических оценок плотности распределений вероятности в таких пространствах [4].

" Пусть - измеримое пространство,. и . суть -конечные меры на ., причем абсолютно непрерывна относительно , т. е. из равенства. . =0 следует равенство =0, где В этом случае на существует неотрицательная измеримая функция такая, что

Перейти на страницу: 1 2 3 4 5 6

Дополнительно

Конструкции и технология изготовления электротехнических изделий
Настоящее методическое пособие предназначено для студентов Института Электротехники, выполняющих курсовые и дипломный проекты (КП и ДП), и призвано оказать им помощь по выполнению конструкторско-технологической части проектов. В связи с введением Единой системы конструкторской документации (ЕСК ...

Планета солнечной системы Уран
Даже в XVIII в. планетная система была известна только до Сатурна. Но уже тогда предполагали, что Сатурном список планет не оканчивается, что существуют еще более далекие планеты, которые невооруженным глазом увидеть нельзя. Это мнение блестяще подтвердилось, когда в 1781 г. знаменитый английский ...

Меню сайта