admin / 13.03.2018
.
Содержание
Зарубежный опыт показывает, что кластеры способны выступать в качестве «полюсов конкурентоспособности» и при наборе определенной «критической массы» становиться полноценными единицами конкурентоспособности на международной арене.
Для описания семейств технологически взаимосвязанных секторов во Франции широко использовался термин «фильеры» [См, например: Toledano J. A propos des fi lieres industrielles // Revue d’Economie Industrielle. 1978. Vol. 6. № 4. P. 149–158.]. По сути, речь шла об организационных формах взаимодействия, демонстрировавших признаки инновационных кластеров. Однако сам термин «инновационные кластеры» (clusters of innovation) приобрел широкую популярность среди лидеров общественного и частного сектора после кластеров в США, носившего название «Clusters of Innovation» [Council on Competitiveness, Monitor Company, and M.
Porter. Clusters of Innovation: National Report. Washington, 2001.]. Он хорошо отражает тот факт, что компании всего мира все чаще вынуждены конкурировать не только и не столько по производительности, сколько с точки зрения способности к инновациям.
Кластеры оказались особенно полезными для стимулирования инноваций, поскольку их структурные особенности и логика развития хорошо сочетаются с характеристиками современных инновационных процессов.
«Модель, по которой создаются конкурентные преимущества в современной экономике, довольно существенно отличается от традиционной модели, которая предусматривала переработку результатов фундаментальных исследований университетов в прикладные продукты и процессы силами внутренних (закрытых) отделов НИОКР корпораций. Современная модель предполагает достижения прикладного результата посредством множественных нелинейных взаимодействий различных компаний, университетов, научно-исследовательских учреждений и общественных организаций, и именно так функционируют кластеры с момента их возникновения (хотя политики и руководители компаний далеко не всегда понимали, какие потенциальные возможности при этом открываются)». (Шерешева М.Ю., «Проблемы создания инновационных кластеров в регионах России» Источник: riep.ru/lib/getfile.php?t=p&n=05000155).
Можно говорить о том, что кластерная форма организации приводит к созданию особой формы инновации – «совокупного инновационного продукта». Объединение в кластер, имеющий отраслевой характер, приводит в силу этой особенности не к спонтанной концентрации разноплановых научных и технологических изобретений, а к возникновению устойчивой системы распространения новых знаний и технологий. Именно формирование сети устойчивых связей между всеми участниками кластера выступает как катализатор трансформации изобретений в инновации, а инноваций – в конкурентные преимущества.
В целом ряде стран задача формирования и укрепления региональных инновационных кластеров стоит в ряду важнейших национальных приоритетов.
США
Именно как о национальном приоритете было сказано о развитии кластеров в США в докладе Совета по конкурентоспособности 2001 года.
В текущем десятилетии в США активно поддерживается и стимулируется образование инновационных кластеров. Основной лозунг американской инновационной политики: «инвестирование в технологии – это инвестирование в будущее Америки». Согласно данным Гарвардской школы бизнеса, кластерный сектор в США является главной движущей силой развития секторов, которые обслуживают локальный рынок. Уровень производительности труда и заработной платы в кластерах существенно выше, чем в среднем по стране.
Большое внимание в США уделяется созданию на базе университетов национальной сети центров внедрения промышленных технологий (от этой меры особенно выигрывает малый бизнес). Широкое распространение нашли различные кооперативные формы организации инновационного творчества – от смешанного капитала и разделения рисков до совместного использования дорогостоящего оборудования. При этом особое внимание уделяется определению и поддержке тех инноваций, которые обеспечивают долговременное развитие бизнеса.
Штат Канзас
В качестве примера деятельности по трансформации экономики региона и созданию инновационной инфраструктуры посредством формирования кластера инновационных технологий можно привести результаты, полученные в штате Канзас, традиционно считавшемся сельскохозяйственным регионом США. [Подробнее см. описание работы KTEC, подготовленное Ю.Л. Владимировым, в монографии: Третьяк В.П. Кластеры предприятий. М.: Август Борг, 2006.
Глава 5.]. По заказу губернатора штата было проведено изучение состояния и перспектив развития экономики Канзаса. В рамках исследования, проведенного Институтом стратегии и конкурентоспособности (Institute for Strategy and Competitiveness [http://www.isc.hbs.edu]) под руководством М. Портера, были выделены кластеры предприятий, которые затем были оценены и классифицированы по роли в экономике штата и по динамике изменений за последние 10 лет. Инструментом развития кластеров стала Канзасская Технологическая корпорация (Kansas Technology Enterprise Corporation, KTEC), учрежденная в 1987 г.
Характерно, что возникновение инновационных кластеров в данном случае стало результатом детально спланированной и осуществленной программы развития: «комплекс инновационных кластеров KTEC является продуктом целевой программы развития экономики штата, программа успешна и продолжает свое развитие, с помощью кластеров в штате Канзас был создан механизм инновационного развития экономики» [Третьяк В.П. Кластеры предприятий. М.: Август Борг, 2006. С. 72.]. Инновационные кластеры KTEC пользуются активной поддержкой со стороны правительства штата. В системе управления развитием инновационного кластера существует строгая иерархия и разделение сфер влияния. Аудиторы правительства штата обеспечивают контроль над финансовой деятельностью KTEC и связанных с ней структур. Специализированный фонд стратегических исследований и разработок осуществляет общий надзор над процессом, тематикой и результативностью научных исследований в университетах, над участниками программ.
Оптический кластер в Аризоне
В 1992 году около 200 компаний, работающих в сфере оптики (в основном в аэрокосмической промышленности) или являющихся поставщиками товаров и услуг для соответствующих производств, объединились в Аризонскую ассоциацию оптической промышленности. В результате возник один из наиболее известных в мире фотонных кластеров, совокупный объем продаж которого за 15 лет вырос с 100 млн долл. до более чем 340 млн долл. [http://www.photonicsclusters.org/whatisacluster.html].
Европейские страны
В Европейском сообществе существует серьезная озабоченность тем фактом, что инвестиции стран сообщества в научно-технологическое развитие уступают инвестициям США и Японии. По мнению Европейской комиссии, ЕС имеет шанс выправить положение, если объединит ресурсы своих стран, в каждой из которых национальная научная политика будет реформирована в соответствии с единым европейским стандартом. Немаловажная роль в этом отводится развитию инновационных кластеров как внутри стран, так и в рамках ЕС.
В наиболее явной форме осуществляют кластерную стратегию такие страны, как Дания, Финляндия, Нидерланды. Среди других стран, включивших кластерную политику в инструментарий стимулирования инновационных процессов в экономике, можно назвать Германию, Италию, Францию, Норвегию, Бельгию, Великобританию, Словению. Так, в Германии с 1995 г. действует программа создания биотехнологических кластеров Bio Regio. В Великобритании правительство определило районы вокруг Эдинбурга, Оксфорда и Юго-Восточной Англии как основные регионы размещения био-технологических фирм.
Дания
В 1989 г. Министерство промышленности Дании запустило 5-летнюю программу по поддержке создания межорганизационных бизнес-сетей, призванных усилить отдачу от инновационной использовать. С учетом отраслевой структуры страны, с 1999 г. стимулируется развитие в двух направлениях. Во-первых, это восемь мегакластеров (семейства технологически взаимосвязанных секторов, таких как строительство, агропищевая индустрия, туризм, транспорт, металлообработка, биотехнологии), для которых была проведена предварительная диагностика и созданы специализированные переговорные группы для балансирования интересов.
Во-вторых, кластеры компетенций, которые мельче, чем мега-кластеры, и предназначены для приближения к определенному властями «идеальному» уровню конкурентоспособности на тех или иных отраслевых рынках, например в ветроэнергетике, производстве молочной продукции и свинины, технических средств для инвалидов и т. д. В начале текущего десятилетия в стране насчитывалось 29 таких кластеров компетенций, и именно в развитии этого типа кластеров особое значение имела деятельность органов местного самоуправления, предоставляющих свою инфраструктуру и способствующих созданию таких «правил игры», которые обеспечивают производство не только частных и отраслевых, но и общественных благ.
Финляндия
В начале 90-х гг. прошлого века в стране были проведены серьезные исследования, посвященные анализу структуры экономики и возможным перспективам развития кластеров. В частности, в 1995 г. был опубликован отчет «Преимущества Финляндии – будущее финских отраслей» («Advantage Finland – The Future of Finnish Industries»). В нем содержались выводы и прогнозы, которые легли в основу промышленной политики Финляндии конца 90-х гг. Ее характерными чертами являются целенаправленное создание общенациональной инновационной системы и опора на кластерный принцип для стимулирования конкурентоспособных производств.
Наиболее известны в мире результаты кластера информационных и телекоммуникационных технологий, значительная часть конечной продукции которого производится компанией Nokia, одним из лидеров мирового рынка.
Nokia, на долю которой приходится до 1/3 суммы общих затрат на научно-исследовательские программы в Финляндии и до 40 % от объема продаж кластера, являет собой пример фокальной компании, которая обеспечивает эффективный контроль над управлением активами предприятий, входящих в кластер, и их координацию. Способствуя усилению позиций отдельных предприятий кластера, Nokia одновременно смогла существенно усилить свои позиции на мировом рынке за счет кумулятивной эффективности кластера. Так, созданные в Финляндии специально под информационный и телекоммуникационный сектор система образования, инновационная система, сеть связанных производств и услуг и т. д. обладают самостоятельной ценностью и формируют условия для развития устойчивых конкурентных преимуществ. В кластере можно выделить еще ряд компаний, играющих
не менее важную роль: SysOpen Digia, Comptel, Sumea. Основными «блоками» в структуре этого кластера являются:
Операторы. Их более 100; доминируют Sonera и Finnet Group.
Контент-провайдеры. Около 300 компаний; Nokia предоставляет им средства разработки контента и поддержку через специально созданный виртуальный форум.
Производители оборудования. Здесь доминирует Nokia.
Поставщики. Большинство производит оборудование под индивидуальный заказ, стандарты качества – высочайшие.
Рынок венчурного капитала. Учреждена специальная ассоциация по поиску и привлечению венчурного капитала – Finnish Venture Association [См.: http://www.fvca.fi].
Образование и исследования. В Финляндии действуют 12 университетов и институтов, входящих в лидирующую группу вузов мира по подготовке ИТ-специалистов, а также исследовательские подразделения IBM, ICL, Siemens, Hewlett Packard и ряда других компаний – лидеров мировой ИТ-индустрии. Все они в той или иной степени вовлечены в деятельность кластера.
Прогнозируемые темпы развития финского кластера информационных и телекоммуникационных технологий до 2015 г. составляют 8,1 % в год, что более чем в 2,5 раза превышает ожидаемые темпы развития экономики страны в целом (3,2 %) [Филиппов П. Кластеры конкурентоспособности // Эксперт Северо-Запад. 2003. № 43 (152) // [Электронный ресурс] http://www.expert.ru/economy/2003].
Нидерланды
В Нидерландах пошли по пути разделения на «мегакластеры» (всего их было выделено 10): сборочные отрасли, химические отрасли, энергетика, агропромышленный комплекс, строительство, СМИ, здравоохранение, коммерческие обслуживающие отрасли, некоммерческие обслуживающие отрасли, транспорт [Цихан Т.В. Кластерная теория экономического развития // Теория и практика управления. 2003. № 5.]. Анализ «потоков знаний» между кластерами позволяет выявить характерные черты инновационных процессов. Оказалось, что 3 кластера (сборочные отрасли, отрасли коммерческих услуг и химические отрасли) служат «нетто-экспортерами» знаний в другие кластеры.
Здравоохранение и некоммерческие услуги (в которых имеются крупные учреждения индустрии знаний) тоже являются «нетто-экспортерами» знаний, хотя и в меньшей степени. «Нетто-импортерами» знаний выступают строительство и средства массовой информации, в то время как агропромышленный, энергетический и транспортный кластеры производят знания, которые сами же потребляют.
Германия
Немецкая модель развития кластеров характеризуется особой ролью федеральных земель: вмешательство на общефедеральном уровне проявляется только в поддержке «сетей компетенций» – в основном в виде довольно четких предложений по налаживанию связей между этими сетями (и, соответственно, регионами их размещения) и их возможными контрагентами в национальном и международном масштабе.
Эти сети компетенций, по сути, являются кластерами, о чем свидетельствуют довольно четко обрисованные государством критерии. Согласно принятым правилам, члены «сети компетенций» должны придерживаться единого стратегического подхода; все члены инновативной производственной цепочки (включая образовательные и исследовательские учреждения, предприятия сферы услуг и разных стадий производственного процесса) должны быть взаимосвязаны; решающая роль придается междисциплинарному и кооперативному характеру взаимодействий.
Основным органом, ответственным за развитие кластеров на федеральном уровне, является Союз немецких инженеров (Verein Deutscher Ingeneure, VDI) – частное агентство, не являющееся, согласно уставу, коммерческой организацией. Это агентство выявляет сети компетенций и затем отбирает те из них, которые полностью соответствуют заданной системе критериев. Экспертиза и отбор должны быть одобрены объединенным комитетом, в который входят представители федеральных земель, городов, федеральных министерств, предприятий и исследовательских организаций. В настоящее время в разных федеральных землях определены и действуют кластеры в сфере энергетики, транспорта и авиастроения, а также около 100 «сетей компетенций», ведущих деятельность в области биотехнологий, нанотехнологий, оптики, разработки медицинского оборудования, информационно-коммуникационных технологий, охраны окружающей среды и т. п.
Франция
Французское правительство создает собственный организационно-правовой механизм, с более выраженным участием государства. В 2004 г. Правительственный комитет по повышению конкурентоспособности (CIACT) объявил национальный тендер на статус «полюса конкурентоспособности», с вытекающими из него финансовыми (субсидии, налоговые льготы) и социальными (облегчение социального бремени) преимуществами, не считая поддержки со стороны Национального агентства стимулирования научных разработок (ANVAR) и Банка развития малого и среднего бизнеса (BDPME). Из 105 проектов было отобрано 67, включая 6 проектов «мирового значения», 9 проектов с «международным потенциалом» и 52 проекта национального и регионального уровня. На их поддержку избюджета в рамках трехлетней программы выделено 1,5 млрд евро [Франция и Россия: перспективы сотрудничества // Тематическое приложение «Страна-партнер» к еженедельнику «Экономика и жизнь». 2006. № 20. С. 18–19].
Создание «полюсов конкурентоспособности» в первую очередь ориентировано на развитие технологических областей: микроэлектроники, нано- и биотехнологий, автомобиле- и авиастроения. В правительстве подчеркивают, что программа создания кластеров нацелена на то, чтобы обеспечить интеграцию между производством, инновациями и наукой, опираясь при этом на регионы, и создать сеть промышленно-научных партнерских единиц национального уровня.
Вклад местных властей Франции в развитие кластеров заключается в обеспечении взаимной открытости и локальных условий для деятельности кластеров на собственных территориях, прежде всего в предоставлении информационной поддержки. В частности, в качестве дополнительной плат формы для развития производительности по месту расположения «полюсов конкурентоспособности» предусмотрено проведение интерактивных акций – форумов по вопросам финансирования инноваций и конкурентоспособности. Первый форум, посвященный проблемам финансирования инновационных предприятий малого и среднего бизнеса, прошел в марте 2006 г. в Лионе на базе полюса Axelera (химия – экология) – Lyonbiopole (биотехнологии); затем прошли форумы в Марселе (полюс безопасных коммуникационных решений), Гренобле (микронанотехнологии), Париже (программное обеспечение, мультимедиа), в Тулузе (авиа- и ракетостроение). В 2007 г. прошли форумы в Ренне (изображения и сети) и Страсбурге (терапевтическая медицина).
В мировой практике сложились следующие основные формы стимулирования малых инновационных предприятий, в том числе и в рамках кластерных промышленных систем:
· прямое финансирование (субсидии, займы), которые достигают 50% расходов на создание новой продукции и технологий (Франция, США и другие страны);
· предоставление ссуд, в том числе без выплаты процентов (Швеция);
· целевые дотации на научно-исследовательские разработки (практически во всех развитых странах);
· создание фондов внедрения инноваций с учетом возможного коммерческого риска (Англия, Германия, Франция, Швейцария, Нидерланды);
· безвозмездные ссуды, достигающие 50% затрат на внедрение новшеств (Германия);
· снижение государственных пошлин для индивидуальных изобретателей (Австрия, Германия, США и др.);
· отсрочка уплаты пошлин или освобождение от них, если изобретение касается экономии энергии (Австрия);
· бесплатное ведение делопроизводства по заявкам индивидуальных изобретателей, бесплатные услуги патентных поверенных, освобождение от уплаты пошлин (Нидерданды, Германия).
©2015-2018 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Нарушение авторских прав и Нарушение персональных данных
Кластерный анализ
Основная цель
Термин кластерный анализ (впервые ввел Tryon, 1939) в действительности включает в себя набор различных алгоритмов классификации. Общий вопрос, задаваемый исследователями во многих областях, состоит в том, как организовать наблюдаемые данные в наглядные структуры, т.е. развернуть таксономии. Например, биологи ставят цель разбить животных на различные виды, чтобы содержательно описать различия между ними. В соответствии с современной системой, принятой в биологии, человек принадлежит к приматам, млекопитающим, амниотам, позвоночным и животным. Заметьте, что в этой классификации, чем выше уровень агрегации, тем меньше сходства между членами в соответствующем классе. Человек имеет больше сходства с другими приматами (т.е. с обезьянами), чем с "отдаленными" членами семейства млекопитающих (например, собаками) и т.д. В последующих разделах будут рассмотрены общие методы кластерного анализа, см. Объединение (древовидная кластеризация), Двувходовое объединение и Метод K средних.
Проверка статистической значимости
Заметим, что предыдущие рассуждения ссылаются на алгоритмы кластеризации, но ничего не упоминают о проверке статистической значимости. Фактически, кластерный анализ является не столько обычным статистическим методом, сколько "набором" различных алгоритмов "распределения объектов по кластерам". Существует точка зрения, что в отличие от многих других статистических процедур, методы кластерного анализа используются в большинстве случаев тогда, когда вы не имеете каких-либо априорных гипотез относительно классов, но все еще находитесь в описательной стадии исследования. Следует понимать, что кластерный анализ определяет "наиболее возможно значимое решение". Поэтому проверка статистической значимости в действительности здесь неприменима, даже в случаях, когда известны p-уровни (как, например, в методе K средних).
Области применения
Техника кластеризации применяется в самых разнообразных областях.
Хартиган (Hartigan, 1975) дал прекрасный обзор многих опубликованных исследований, содержащих результаты, полученные методами кластерного анализа. Например, в области медицины кластеризация заболеваний, лечения заболеваний или симптомов заболеваний приводит к широко используемым таксономиям. В области психиатрии правильная диагностика кластеров симптомов, таких как паранойя, шизофрения и т.д., является решающей для успешной терапии. В археологии с помощью кластерного анализа исследователи пытаются установить таксономии каменных орудий, похоронных объектов и т.д. Известны широкие применения кластерного анализа в маркетинговых исследованиях. В общем, всякий раз, когда необходимо классифицировать "горы" информации к пригодным для дальнейшей обработки группам, кластерный анализ оказывается весьма полезным и эффективным.
Объединение (древовидная кластеризация)
Общая логика
Приведенный в разделе Основная цель пример поясняет цель алгоритма объединения (древовидной кластеризации). Назначение этого алгоритма состоит в объединении объектов (например, животных) в достаточно большие кластеры, используя некоторую меру сходства или расстояние между объектами. Типичным результатом такой кластеризации является иерархическое дерево.
Иерархическое дерево
Рассмотрим горизонтальную древовидную диаграмму. Диаграмма начинается с каждого объекта в классе (в левой части диаграммы). Теперь представим себе, что постепенно (очень малыми шагами) вы "ослабляете" ваш критерий о том, какие объекты являются уникальными, а какие нет. Другими словами, вы понижаете порог, относящийся к решению об объединении двух или более объектов в один кластер.
В результате, вы связываете вместе всё большее и большее число объектов и агрегируете (объединяете) все больше и больше кластеров, состоящих из все сильнее различающихся элементов. Окончательно, на последнем шаге все объекты объединяются вместе. На этих диаграммах горизонтальные оси представляют расстояние объединения (в вертикальных древовидных диаграммах вертикальные оси представляют расстояние объединения). Так, для каждого узла в графе (там, где формируется новый кластер) вы можете видеть величину расстояния, для которого соответствующие элементы связываются в новый единственный кластер. Когда данные имеют ясную "структуру" в терминах кластеров объектов, сходных между собой, тогда эта структура, скорее всего, должна быть отражена в иерархическом дереве различными ветвями. В результате успешного анализа методом объединения появляется возможность обнаружить кластеры (ветви) и интерпретировать их.
Меры расстояния
Объединение или метод древовидной кластеризации используется при формировании кластеров несходства или расстояния между объектами. Эти расстояния могут определяться в одномерном или многомерном пространстве. Например, если вы должны кластеризовать типы еды в кафе, то можете принять во внимание количество содержащихся в ней калорий, цену, субъективную оценку вкуса и т.д. Наиболее прямой путь вычисления расстояний между объектами в многомерном пространстве состоит в вычислении евклидовых расстояний. Если вы имеете двух- или трёхмерное пространство, то эта мера является реальным геометрическим расстоянием между объектами в пространстве (как будто расстояния между объектами измерены рулеткой). Однако алгоритм объединения не "заботится" о том, являются ли "предоставленные" для этого расстояния настоящими или некоторыми другими производными мерами расстояния, что более значимо для исследователя; и задачей исследователей является подобрать правильный метод для специфических применений.
Евклидово расстояние. Это, по-видимому, наиболее общий тип расстояния. Оно попросту является геометрическим расстоянием в многомерном пространстве и вычисляется следующим образом:
расстояние(x,y) = {i (xi — yi)2 }1/2
Заметим, что евклидово расстояние (и его квадрат) вычисляется по исходным, а не по стандартизованным данным. Это обычный способ его вычисления, который имеет определенные преимущества (например, расстояние между двумя объектами не изменяется при введении в анализ нового объекта, который может оказаться выбросом).
Тем не менее, на расстояния могут сильно влиять различия между осями, по координатам которых вычисляются эти расстояния. К примеру, если одна из осей измерена в сантиметрах, а вы потом переведете ее в миллиметры (умножая значения на 10), то окончательное евклидово расстояние (или квадрат евклидова расстояния), вычисляемое по координатам, сильно изменится, и, как следствие, результаты кластерного анализа могут сильно отличаться от предыдущих.
Квадрат евклидова расстояния. Иногда может возникнуть желание возвести в квадрат стандартное евклидово расстояние, чтобы придать большие веса более отдаленным друг от друга объектам. Это расстояние вычисляется следующим образом (см. также замечания в предыдущем пункте):
расстояние(x,y) = i (xi — yi)2
Расстояние городских кварталов (манхэттенское расстояние). Это расстояние является просто средним разностей по координатам. В большинстве случаев эта мера расстояния приводит к таким же результатам, как и для обычного расстояния Евклида. Однако отметим, что для этой меры влияние отдельных больших разностей (выбросов) уменьшается (так как они не возводятся в квадрат). Манхэттенское расстояние вычисляется по формуле:
расстояние(x,y) = i |xi — yi|
Расстояние Чебышева.
Это расстояние может оказаться полезным, когда желают определить два объекта как "различные", если они различаются по какой-либо одной координате (каким-либо одним измерением). Расстояние Чебышева вычисляется по формуле:
расстояние(x,y) = Максимум|xi — yi|
Степенное расстояние. Иногда желают прогрессивно увеличить или уменьшить вес, относящийся к размерности, для которой соответствующие объекты сильно отличаются. Это может быть достигнуто с использованием степенного расстояния. Степенное расстояние вычисляется по формуле:
расстояние(x,y) = (i |xi — yi|p)1/r
где r и p — параметры, определяемые пользователем. Несколько примеров вычислений могут показать, как "работает" эта мера. Параметр p ответственен за постепенное взвешивание разностей по отдельным координатам, параметр r ответственен за прогрессивное взвешивание больших расстояний между объектами.
Если оба параметра — r и p, равны двум, то это расстояние совпадает с расстоянием Евклида.
Процент несогласия. Эта мера используется в тех случаях, когда данные являются категориальными. Это расстояние вычисляется по формуле:
расстояние(x,y) = (Количество xi yi)/ i
Правила объединения или связи
На первом шаге, когда каждый объект представляет собой отдельный кластер, расстояния между этими объектами определяются выбранной мерой. Однако когда связываются вместе несколько объектов, возникает вопрос, как следует определить расстояния между кластерами? Другими словами, необходимо правило объединения или связи для двух кластеров. Здесь имеются различные возможности: например, вы можете связать два кластера вместе, когда любые два объекта в двух кластерах ближе друг к другу, чем соответствующее расстояние связи. Другими словами, вы используете "правило ближайшего соседа" для определения расстояния между кластерами; этот метод называется методом одиночной связи. Это правило строит "волокнистые" кластеры, т.е. кластеры, "сцепленные вместе" только отдельными элементами, случайно оказавшимися ближе остальных друг к другу. Как альтернативу вы можете использовать соседей в кластерах, которые находятся дальше всех остальных пар объектов друг от друга. Этот метод называется метод полной связи. Существует также множество других методов объединения кластеров, подобных тем, что были рассмотрены.
Одиночная связь (метод ближайшего соседа). Как было описано выше, в этом методе расстояние между двумя кластерами определяется расстоянием между двумя наиболее близкими объектами (ближайшими соседями) в различных кластерах. Это правило должно, в известном смысле, нанизывать объекты вместе для формирования кластеров, и результирующие кластеры имеют тенденцию быть представленными длинными "цепочками".
Полная связь (метод наиболее удаленных соседей). В этом методе расстояния между кластерами определяются наибольшим расстоянием между любыми двумя объектами в различных кластерах (т.е. "наиболее удаленными соседями"). Этот метод обычно работает очень хорошо, когда объекты происходят на самом деле из реально различных "рощ". Если же кластеры имеют в некотором роде удлиненную форму или их естественный тип является "цепочечным", то этот метод непригоден.
Невзвешенное попарное среднее. В этом методе расстояние между двумя различными кластерами вычисляется как среднее расстояние между всеми парами объектов в них. Метод эффективен, когда объекты в действительности формируют различные "рощи", однако он работает одинаково хорошо и в случаях протяженных ("цепочного" типа) кластеров.
Отметим, что в своей книге Снит и Сокэл (Sneath, Sokal, 1973) вводят аббревиатуру UPGMA для ссылки на этот метод, как на метод невзвешенного попарного арифметического среднего — unweighted pair-group method using arithmetic averages.
Взвешенное попарное среднее. Метод идентичен методу невзвешенного попарного среднего, за исключением того, что при вычислениях размер соответствующих кластеров (т.е. число объектов, содержащихся в них) используется в качестве весового коэффициента. Поэтому предлагаемый метод должен быть использован (скорее даже, чем предыдущий), когда предполагаются неравные размеры кластеров. В книге Снита и Сокэла (Sneath, Sokal, 1973) вводится аббревиатура WPGMA для ссылки на этот метод, как на метод взвешенного попарного арифметического среднего —weighted pair-group method using arithmetic averages.
Невзвешенный центроидный метод. В этом методе расстояние между двумя кластерами определяется как расстояние между их центрами тяжести. Снит и Сокэл (Sneath and Sokal (1973)) используют аббревиатуру UPGMC для ссылки на этот метод, как на метод невзвешенного попарного центроидного усреднения — unweighted pair-group method using the centroid average.
Взвешенный центроидный метод (медиана). тот метод идентичен предыдущему, за исключением того, что при вычислениях используются веса для учёта разницы между размерами кластеров (т.е. числами объектов в них). Поэтому, если имеются (или подозреваются) значительные отличия в размерах кластеров, этот метод оказывается предпочтительнее предыдущего. Снит и Сокэл (Sneath, Sokal 1973) использовали аббревиатуру WPGMC для ссылок на него, как на метод невзвешенного попарного центроидного усреднения — weighted pair-group method using the centroid average.
Метод Варда. Этот метод отличается от всех других методов, поскольку он использует методы дисперсионного анализа для оценки расстояний между кластерами. Метод минимизирует сумму квадратов (SS) для любых двух (гипотетических) кластеров, которые могут быть сформированы на каждом шаге. Подробности можно найти в работе Варда (Ward, 1963). В целом метод представляется очень эффективным, однако он стремится создавать кластеры малого размера.
Для обзора других методов кластеризации, см. Двухвходовое объединение и Метод K средних.
Двувходовое объединение
Вводный обзор
Ранее этот метод обсуждался в терминах "объектов", которые должны быть кластеризованы (см. Объединение (древовидная кластеризация)). Во всех других видах анализа интересующий исследователя вопрос обычно выражается в терминах наблюдений или переменных. Оказывается, что кластеризация, как по наблюдениям, так и по переменным может привести к достаточно интересным результатам. Например, представьте, что медицинский исследователь собирает данные о различных характеристиках (переменные) состояний пациентов (наблюдений), страдающих сердечными заболеваниями. Исследователь может захотеть кластеризовать наблюдения (пациентов) для определения кластеров пациентов со сходными симптомами. В то же самое время исследователь может захотеть кластеризовать переменные для определения кластеров переменных, которые связаны со сходным физическим состоянием.
Двувходовое объединение
После этого обсуждения, относящегося к тому, кластеризовать наблюдения или переменные, можно задать вопрос, а почему бы не проводить кластеризацию в обоих направлениях? Модуль Кластерный анализ содержит эффективную двувходовую процедуру объединения, позволяющую сделать именно это. Однако двувходовое объединение используется (относительно редко) в обстоятельствах, когда ожидается, что и наблюдения и переменные одновременно вносят вклад в обнаружение осмысленных кластеров.
Так, возвращаясь к предыдущему примеру, можно предположить, что медицинскому исследователю требуется выделить кластеры пациентов, сходных по отношению к определенным кластерам характеристик физического состояния. Трудность с интерпретацией полученных результатов возникает вследствие того, что сходства между различными кластерами могут происходить из (или быть причиной) некоторого различия подмножеств переменных. Поэтому получающиеся кластеры являются по своей природе неоднородными. Возможно это кажется вначале немного туманным; в самом деле, в сравнении с другими описанными методами кластерного анализа (см. Объединение (древовидная кластеризация) и Метод K средних), двувходовое объединение является, вероятно, наименее часто используемым методом. Однако некоторые исследователи полагают, что он предлагает мощное средство разведочного анализа данных (за более подробной информацией вы можете обратиться к описанию этого метода у Хартигана (Hartigan, 1975)).
Метод K средних
Общая логика
Этот метод кластеризации существенно отличается от таких агломеративных методов, как Объединение (древовидная кластеризация) и Двувходовое объединение. Предположим, вы уже имеете гипотезы относительно числа кластеров (по наблюдениям или по переменным). Вы можете указать системе образовать ровно три кластера так, чтобы они были настолько различны, насколько это возможно. Это именно тот тип задач, которые решает алгоритм метода K средних. В общем случае метод K средних строит ровно K различных кластеров, расположенных на возможно больших расстояниях друг от друга.
Пример
В примере с физическим состоянием (см. Двувходовое объединение), медицинский исследователь может иметь "подозрение" из своего клинического опыта, что его пациенты в основном попадают в три различные категории. Далее он может захотеть узнать, может ли его интуиция быть подтверждена численно, то есть, в самом ли деле кластерный анализK средних даст три кластера пациентов, как ожидалось? Если это так, то средние различных мер физических параметров для каждого кластера будут давать количественный способ представления гипотез исследователя (например, пациенты в кластере 1 имеют высокий параметр 1, меньший параметр 2 и т.д.).
Вычисления
С вычислительной точки зрения вы можете рассматривать этот метод, как дисперсионный анализ (см. Дисперсионный анализ) "наоборот". Программа начинает с K случайно выбранных кластеров, а затем изменяет принадлежность объектов к ним, чтобы: (1) — минимизировать изменчивость внутри кластеров, и (2) — максимизировать изменчивость между кластерами. Данный способ аналогичен методу "дисперсионный анализ (ANOVA) наоборот" в том смысле, что критерий значимости в дисперсионном анализе сравнивает межгрупповую изменчивость с внутригрупповой при проверке гипотезы о том, что средние в группах отличаются друг от друга. В кластеризации методом K средних программа перемещает объекты (т.е. наблюдения) из одних групп (кластеров) в другие для того, чтобы получить наиболее значимый результат при проведении дисперсионного анализа (ANOVA).
Интерпретация результатов
Обычно, когда результаты кластерного анализа методом K средних получены, можно рассчитать средние для каждого кластера по каждому измерению, чтобы оценить, насколько кластеры различаются друг от друга. В идеале вы должны получить сильно различающиеся средние для большинства, если не для всех измерений, используемых в анализе. Значения F-статистики, полученные для каждого измерения, являются другим индикатором того, насколько хорошо соответствующее измерение дискриминирует кластеры.
Все права на материалы электронного учебника принадлежат компании StatSoft
В иерархических методах каждое наблюдение образовывает сначала свой отдельный кластер. На первом шаге два соседних кластера объединяются в один; этот процесс может продолжаться до тех пор, пока не останутся только два кластера. В методе, который в SPSS установлен по умолчанию (Between-groups linkage (Связь между группами)), расстояние между кластерами является средним значением всех расстояний между всеми возможными парами точек из обоих кластеров.
Соберем заданные 17 сортов пива в кластеры при помощи параметров kalorien (калории) и kosten (расходы).
Вы увидите диалоговое окно Hierarchical Cluster Analysis (Иерархический кластерный анализ) (см. рис. 20.3).
Поэтому, для верности активируйте Range of solutions: (Область решений) и введите числа 2 и 5 в качестве границ области.
Рис.
20.3: Диалоговое окно Hierarchical Cluster Analysis (Иерархический кластерный анализ)
SPSS предлагает, в общей сложности, семь различных методов объединения, которые будут рассмотрены в главе 20.4. Метод Between-groups linkage (Связь между группами) устанавливается по умолчанию.
Дистанционные меры и меры подобия зависят от вида переменных, участвующих в анализе, то есть выбор меры зависит от типа переменной и шкалы, к которой она относится: интервальная переменная, частоты или бинарные (дихотомические) данные. В рассматриваемом примере фигурируют данные, относящиеся к интервальной шкале, для которых по умолчанию в качестве дистанционной меры устанавливается квадрат евклидового расстояния (Squared Euclidean distance). Некоторые дистанционные меры и меры подобия будут рассмотрены в главе 20.3.
FILED UNDER : IT