Метод ограниченного хаоса [Глеб Алексеевич Архангельский] (fb2) читать постранично, страница - 4


 [Настройки текста]  [Cбросить фильтры]

нескольких нечетких критериев кластеризации для задач из области техники личной работы и для социальных задач?

Кластерный анализ и метод ограниченного хаоса

Напомним вкратце суть кластерного анализа. Имеется N объектов, каждый характеризуется m признаками. Признаки могут допускать измерение с помощью линейных шкал (температура, скорость…), а могут и не допускать, и тогда приходится применять ординальные шкалы.

В пространстве объектов вводится метрика — расстояние между объектами, тем или иным образом определяемое с помощью их признаков. Например, если объекты — точки на плоскости, а признаки — их координаты в декартовой системе координат, то распространенный способ введения метрики — считать расстоянием между точками число, равное корню квадратному из суммы квадратов разностей координат по каждой оси.

На основании каким-либо образом введенного расстояния между объектами, с помощью различных методов эти объекты группируются в кластеры — группы объектов, близких друг другу с точки зрения выбранной метрики. Такими кластерами могут быть, например, основные направления политической ориентации населения или разделы тематического каталога библиотеки.

Зафиксируем важнейшее отличие кластерного анализа от описанного выше метода. Кластерный анализ лишь выявляет степень близости объектов. Метод говорит о том, каким образом вмешиваться в ситуацию с точки зрения максимизации функции полезности. Вспоминая различение «научных» и «инженерных» задач из начала статьи, можно сказать, что кластерный анализ входит в совокупность «научного материала», который мы пытаемся перевести «в методологическую плоскость».

Итак, кластерный анализ может быть вспомогательным инструментом метода, особенно если совокупную полезность удастся свести к признакам элементов и способам задания метрики, т. е. кластерный анализ будет сразу же давать информацию о том, где проводить границы, и не потребуется проводить дополнительного исследования кластеризации, которую он предлагает, на оптимальность с точки зрения максимизации полезности. Примером возможности сведения функции полезности к признакам объектов и способам задания расстояния между объектами может служить такая ее подлежащая минимизации компонента, как «количество нежелательных взаимодействий» (вспомним сапоги, хранимые вместе с бумагами). Отметив принципиальную возможность работы в этом направлении, дальше углубляться в этот вопрос не будем.

Хаос в строгом смысле слова

«Читатель ждет уж рифмы “розы”…», а в нашем случае — определений порядка и хаоса. Однако мы не будем давать определений, а ограничимся лишь различением. Определение задает некую со всех сторон ограниченную (определенную) область действительности, к которой прикрепляется соответствующий ярлычок. Это удобно при построении системы понятий, при взаимоувязке многих определений. Но за удобство приходится платить большей конкретностью введенных понятий и соответственно меньшей «удобопереносимостью» их в другие области. Различение, в отличие от определения, открыто, это прямая, делящая плоскость на две полуплоскости, а не замкнутая кривая, выделяющая из плоскости некоторую область. Поэтому в контексте построения метода, как наиболее абстрактной нормы деятельности, различение уместнее определения, и может быть впоследствии конкретизировано исходя из потребностей ситуации, в которой будет применяться метод.

Различение порядка и хаоса можно строить, опираясь на большое количество более фундаментальных различений (равновесность — неравновесность, убывание — возрастание энтропии, и т. п.[6]) Для наших целей достаточно одного: предсказуемость — непредсказуемость. Это различение уже появлялось ранее, но «в статике», как большая или меньшая легкость отыскания нужного предмета в комнате. Сейчас мы перейдем к динамике.

С момента поступления в комнату параметры объектов не изменялись со временем. Рассмотрим теперь объекты, которые изменяются со временем. Будем считать, что зависимости параметров от времени нелинейные. Добавим неустойчивость: малые отклонения в начальных значениях параметров не затухают со временем, а усиливаются. В итоге получим некоторый уровень непредсказуемости во времени. Она характеризуется тем, насколько достоверные высказывания мы сможем строить о различных будущих состояниях системы. Вспомним поиск вещи в комнате: ситуации полной неопределенности соответствовало равномерное распределение вероятности найти вещь в том или ином месте комнаты. Ситуация полной определенности — единичная вероятность найти вещь в одной точке комнаты, и нулевая — в любой другой точке. Последовательные ограничения хаоса давали ступенчатую функцию вероятности, лежащую «посередине» между двумя описанными крайностями и дающую максимум совокупной