Интерактивное исследование неколичественных данных: методика и инструментарий
Категория реферата: Рефераты по информатике, программированию
Теги реферата: реферат беларусь, онегин сочинение
Добавил(а) на сайт: Ленина.
Предыдущая страница реферата | 1 2 3 4 5 6 7 8 9 10 11 | Следующая страница реферата
* * *
Перейдем к примеру исследования, реализующего то, что выше было описано как второй сценарий.
Предлагаемый к рассмотрению набор данных содержит сведения о членах 1-ой Государственной Думы 1906-ого года. Все данные в нем являются качественными и были извлечены из текстовых источников, таких как биографии, справочники и т.п. Набор данных содержит сведения о фракционной принадлежности каждого депутата и некоторые его социальные характеристики[4].
Рассматриваемые данные используются для выяснения того, существовало ли какое-либо соответсвие между принадлежностъю к фракции и социальным профилем депутата. В центре исследования стоят две наиболее крупные фракции 1-ой Государственной Думы - трудовики и кадеты.
Соответствующая формальная гипотеза, которая должна быть верифицирована, формулируется следующим образом:
cуществуют относительно однородные (в терминах социальных характеристик) группы лиц;
cуществует соответствие между этими группами и принадлежностью к фракции. Т.е. существуют "типичный трудовик" и "типичный кадет", которые представляют ядра своих фракций.
Формальная задача разбивается на следующие четыре шага:
найти типичные характеристики для каждой фракции;
найти эталонных депутатов;
построить кластеры депутатов, игнорируя их фракционную принадлежность;
исследовать пересечение полученных кластеров и подмножеств, задаваемых значениями "трудовик" и "кадет".
При решении этой задачи мы должны очевидно следовать второму сценарию, поскольку здесь мы имеем дело с априорной классификацией, задаваемой фракционной принадлежностью, которую мы должны сопоставить с классами, получаемыми по совокупности других свойств объектов.
Выполнить первый шаг - означает найти два кластера свойств, близких (сильно коррелирующих) к свойствам "трудовик" и "кадет" (являющихся в этом случае эталонными). Поскольку нашей целью является нахождение свойств, характерных для каждой из фракций и только для нее, то разумно использовать симметричную близость. В принципе, можно использовать и пару асимметричных близостей. При выборе типа классификации мы остановимся на покрытии, поскольку нам необходимо видеть, пересекаются ли два искомых класера (делят ли они некоторые свойства). Таблица 1 представляет результаты классификации при нижнем пороге равном 0.2 и верхнем - 1. Все показанные свойства, кроме "русский", характерны только для одной фракции.
Таблица 1. Близости основных свойств до эталонных.
Эталоны |
Свойства |
Трудовик |
Кадет |
|||
трудовик |
трудовик |
1.000 |
0.000 |
|||
русский |
0.199 |
0.242 Рекомендуем скачать другие рефераты по теме: древний египет реферат, отцы и дети сочинение. Предыдущая страница реферата | 1 2 3 4 5 6 7 8 9 10 11 | Следующая страница реферата Поделитесь этой записью или добавьте в закладкиКатегории: |