Самоорганизующиеся карты Кохонена

Материал из WitologyWiki

Перейти к: навигация, поиск

Самоорганизующиеся карты Кохонена (англ. Self-organizing map – SOM) – один из частных видов нейронных сетей. Карты Кохонена – инструмент для обнаружения взаимосвязей между объектами. Формально, карты Кохонена – это метод проецирования многомерного пространства наблюдений на пространство более низкой размерности (чаще всего, двухмерное) – карту. Поэтому карты Кохонена часто используют для решения задач визуализация и кластеризации.

Рис. 1. Самоорганизующаяся карта Кохонена с шестиугольными ячейками. Большинство ячеек соответствуют одной стране, некоторые – двум. Есть и пустые. Страны с высоким качеством жизни расположены в верхнем левом углу карты, а с низким – в нижнем правом. Кластеры стран образуют на карте регионы, имеющие похожие цвета: желтые, зеленые, красные и т.д.

Содержание

История

Как и все искусственные нейронные сети, модель Кохонена (1984 г.) – это модель процессов, проходящих в сетях нервных клеток живого организма. Некоторые отделы мозга состоят из цепочек нейронов или из сети, лежащей на одной плоскости, то есть, имеют одно- или двухмерную структуру. Однако сенсорные ощущения человека многомерны. Так, например, мы воспринимаем цвета с помощью трех различных видов рецепторов. Помимо цвета, мы видим еще и объем, расположение, текстуру объекта. Естественный вопрос: как простые структуры в мозгу справляются с многомерными сигналами? Модель Кохонена – это математическая модель проецирования многомерных сигналов окружающей среды на структуры меньшей размерности в мозгу.

Структура самоорганизующихся карт

Элементы самоорганизующейся карты называют узлами или нейронами. Узлы некоторым образом связаны между собой, например, они могут образовывать решетку (располагаться по углам клеток, как в тетрадках). Число узлов в карте и ее структуру выбирает аналитик. Каждому узлу в соответствие ставятся два набора параметров: координаты узла и вес. По координатам узла на карте можно определить его соседей – ближайшие узлы. Веса – это главный элемент модели Кохонена. Каждому узлу соответствует вектор весов, равный по размерности количеству входных наблюдений. Таким образом, для каждого наблюдения находят свой вес. Веса рассчитываются с помощью итеративной процедуры, в ходе которой параметры карты подгоняются под наблюдения. По ее завершении, самоорганизующаяся карта построена.

Использование самоорганизующихся карт

Основные направления применения самоорганизующихся карт – поиск и анализ взаимосвязей и закономерностей во входных данных:
Рис. 2. Цветовая разметка карты Кохонена, перенесенная на карту мира. Пример. Самоорганизующаяся карта была построена по нескольким показателям качества жизни в разных странах. По этим данным были найдены кластеры стран.
  • Кластеризация – нахождение групп похожих объектов. Каждому из данных объектов соответствует набор весов. По весам вычисляют расстояние между рассматриваемыми объектами и находят группы объектов, такие, что внутри групп расстояния между объектами меньше, чем до соседних групп. Полученные кластеры отображают на двухмерном рисунке, что позволяет наглядно и легко интерпретировать изображение кластеров.
  • Визуализация данных. После того, как карта сформирована, ее можно изобразить в виде серии двухмерных изображений (сколько размерностей во входных данных, столько и изображений). На рисунках цветом обозначают, насколько велико значение рассматриваемой компоненты вектора весов в том или ином узле. Чаще всего пользуются градиентными палитрами: чем меньше значение в узле карты, тем темнее соответствующий участок изображения, по аналогии с географическими картами.

Ссылки

Личные инструменты