Информационная технология
5

Главные задачи:

                   Разработка типологии либо классификации.

                   Исследование нужных концептуальных схем группирования объектов.

                   Порождение гипотез на базе исследования данных.

                   Проверка гипотез либо исследования для определения, действительно ли разновидности (категории), выделенные каким-нибудь методом, находятся в наличествующих данных.

Вне зависимости от предмета исследования использование кластерного анализа подразумевает последующие этапы:

                   Отбор выборки для кластеризации. Предполагается, что целесообразно кластеризовать исключительно количественные данные.

                   Определение огромного количества переменных, по которым станут оцениваться объекты в выборке, другими словами признакового пространства.

                   Вычисление значений той или иной меры однообразия (либо отличия) между объектами.

                   Использование способа кластерного анализа для создания групп схожих объектов.

                   Проверка правдивости итогов кластерного решения.

 

Разновидности входных данных.

Признаковое описание объектов. Любой объект описывается комплектом собственных характеристик, именуемых признаками. Признаки могут быть числовыми либо нечисловыми.

Матрица расстояний между объектами. Любой объект описывается расстояниями до всех других объектов метрического пространства.

Матрица сходства между объектами. Предусматривается степень однообразия объекта с иными объектами подборки в метрическом месте. Однообразие здесь дополняет расстояние между объектами до 1.