Алгоритм
Дата: March 01, 2005 01:35AM
Здравствуйте, Евгения.
По всей видимости, Вам нужно просто сравнить достоверность отличий двух групп испытуемых, например, с высокой и низкой агрессивностью по уровню упорства, посчитав различия отдельно для девочек и отдельно для мальчиков.
Выборки получились маленькие, но попробовать стоит
Сначала потребуется импортировать из формата MS Excel таблицу в программу STATISTICA 6.0,
Возможный алгоритм выполнения.
I. подготовьте таблицу в «Экселе» для импорта в «Статистику»:
· если данные для нескольких сравниваемых групп находятся в разных таблицах – объедините их в одну «Экселевскую», просто в новой таблице отведите для обозначения этих групп отдельные столбики, например, если сравниваются разные школьные классы – добавьте столбик «класс», куда записывайте номер класса: 9, 10, или другой. Если вам нужно различать эти классы по буквам (а, б, в) добавь те столбик «буква». Обязательно учитывается пол испытуемых и добавляем столбик «пол» и т.п.
· Объединив разрозненные таблицы в одну, убедитесь, что одна импортируемая таблица занимает один рабочий лист «Экселя»,
· таблица расположена точно в верхнем левом углу листа «Экселя»,
· для названий столбцов (переменных) отведена только первая верхняя строка таблицы,
· имена (коды) испытуемых находятся только в первом левом столбце таблицы,
· таблица содержит только первичные тестовые данные испытуемых. То есть в нижней части столбцов, содержащих значения обследованных респондентов, отсутствуют значения средних и других показателей.
· на всякий случай очистите форматы в таблице «Экселя» (команды меню: Правка – Очистить – Форматы),
· убедитесь, что рабочий лист «Экселя» содержит только импортируемую в статистику таблицу.
· сохраните файл и закройте его на время импорта в «Статистику», чтобы избежать одновременного доступа к одному файлу двух разных программ.
II.
· импортируйте в «Статистику» рабочий лист «Экселя», для этого просто откройте его в «Статистике».
o Например, запустив программу STATISTICA 6.0, выбираем пункты меню: File – Open. Появляется диалоговое окно:
o В котором выбираем тип файлов Data Files:
o
o это позволит программе «увидеть» ваш «экселевский» файл
o далее находите при помощи этого диалогового окна Ваш файл на компьютере и выбираете «открыть».
o Появляется диалоговое окно, в котором программа спрашивает, какие рабочие листы «Экселя» Вам нужны.
o
o обычно я выбираю “Import selected sheet to a Spreadsheet” – импортировать отдельный лист в виде файла данных.
o Далее программа спрашивает:
o какой именно рабочий лист берется для работы. Выбираем…
o Затем спрашивается, есть ли там названия строк в первом столбце (первый квадратик), названия переменных в первой строке (второй квадратик), и нужно ли сохранять оформление шрифтов (нижний квадратик):
o жмем «ОК» и получаем результат.
o При этом фамилии (коды испытуемых), оказались за пределами поля таблицы – на сером фоне справа. Названия переменных (характеристик) также оказались на сером фоне сверху.
Затем считаем U-критерий:
U-критерий Манна-Уитни используется для оценки достоверности различий между средними двух независимых выборок (групп).
Сначала о том, как «вообще» это делается:
Для того, чтобы рассчитать этот критерий при помощи статистических программ, в исходной таблице данных должен быть столбец (группирующая переменная), в котором для каждого испытуемого указано, к какой из сравниваемых групп он принадлежит. Например, если определяется достоверность различий между юношами и девушками, в таблице должен быть столбик «пол», с обозначениями, допустим, «м» и «ж».
Выбираем нужный метод: меню “Statistics – Nonparametrics (непараметрические методы). Открывается диалоговое окно.
Поскольку U-критерий применяется для сравнения независимых выборок, выбираем «Сравнение двух независимых групп» (Comparing two independent...):
и жмём ОК.
В появившемся диалоговом окне жмём Variables (переменные), чтобы указать программе, что именно обрабатывать.
Появляется диалоговое окошко со списком переменных:
в этой версии «Статистики» группирующую переменную (одну!) нужно выбрать в списке переменных справа. Если мы сравниваем юношей и девушек, то такой группирующей переменной будет ПОЛ.
Затем в списке слева выбираем количественные переменные, по которым ищем достоверные различия между ними. Обычно это делается при помощи мышки: прижав правую кнопку мышки на первой нужной переменной в списке она протягивается черех весь нужный диапазон. Прижимая клавишу ”CTRL” (Control) можно «щелкать» по обозначениям нужных переменных, добавляя или убирая их из списка для обработки. Можно просто внести номера переменных в строку снизу. Выбрав переменные жмем ОК.
В программе стоит ограничение на число переменных одновременно обрабатывающихся за один раз непараметрическими методами (чуть больше 20-ти). Поэтому поводу программа может выдать сообщение ... и придется сократитьчисло переменных в списке слева.
Жмем ОК.
Появляется исходное диалоговое окно, в котором программа сама старается распознать градации группирующей переменной:
т.е.Codes for Group 1 & Group 2.
Если градаций группирующей переменной больше двух (и Вы все же хотите воспользоваться этим критерием) или программа запуталась с кодами, можно пощёлкать мышкой по белому прямоугольничку с кодом для группы и в выпавшем списке выбрать его самостоятельно.
Когда все параметры установлены, жмем мышкой кнопку “M-W U test” или “Mann-Whitney U test” и наслаждаемся результатом ))).
Для большинства статистических критериев, в компьютерном варианте, психологу достаточно найти в итоговых таблицах волшебное p-level. За небольшим исключением – это вероятность нулевой гипотезы. Она же вероятность ошибки нашего утверждения о том, что две сравниваемые между собой выборки отличаются достоверно. Для гуманитарных наук и биомедицины, чтобы доказать достоверность отличий между выборками (альтернативную гипотезу) достаточно, чтобы p была меньше или равна 0,05, или, выражаясь в «уровнях значимости», уровень значимости нулевой гипотезы a был меньше или равен 5%.
Иногда статистические пакеты прописывают несколько вероятностей нулевой гипотезы. Это примерно те же результаты, но с учетом разного рода поправок. Для непараметрических критериев это, как правило, поправки на повторяющиеся ранги (значения). (Как тут не вспомнить понятия «гомоморфизм» и «изоморфизм» из репрезентационной теории измерения?)
Обычно разница столь незначительна, что можно выбрать любой понравившийся столбик.
Обратите внимание, что для установок по умолчанию STATISTACA 6.0 компонует результаты в рабочую книгу, подобно тому, как это давно уже делает программа SPSS.
В левой части окна рабочей книги есть древо отображаемых в ней результатов. Можно щелкать мышкой по элементам его структуры, переходя от одних итоговых таблиц или графиков к другим.
Теперь мы знаем, по каким признакам группы отличаются достоверно. Как незначительную недоработку разработчиков статистических пакетов можно указать отсутствие в итоговых таблицах хоть каких-нибудь средних для сравниваемых групп. По таблице не особенно видно, в какой именно группе показатели выше, а в какой – ниже.
Так что средние можно посмотреть отдельно. Но сейчас писать об этом не буду.
Для Вашей работы имеет смысл сравнить высоко агрессивных девушек и высокоагрессивных юношей, низкоагрессивных девушек и низкоагрессивных юношей, затем высокоагрессивных и низкоагрессивных, отдельно юношей и отдельно девушек.
Для этого можно воспользоваться кнопочкой “Select cases”, в просторечье именуемой «фильтром». Она есть почти во всех диалоговых окнах.
Щелкаем по ней и в появившемся диалоговом окне активируем фильтр, выставив флажки: “Enable Selection Conditions”, “Specific, selected by”, затем указываем, какие строки брать программе для работы.
Смотрим, например, номер столбца, в котором указано «высокоагрессивные» или «низкоагрессивные». Пощелкав несколько раз по его названию (на сером поле) в выпадающем меню выбираем ”Text labels” и смотрим, какие цифровые обозначения присвоила им система.
Допустим, качественные градации агрессивности оказались во втором столбце, а высокоагрессивным программа приписала число 101, тогда в поле “Specific, selected by” пишем v2=101 и компьютер возьмет для обработки только высокоагрессивных и можно будет сравнить, например, высокоагрессивных юношей и высокоагрессивных девушек.
Максим Соколовский.
P.S. "Ненавижу" относится к часто встречающейся тенденции "стандартизировать" первичные данные как бог на душу пошлет и переводя баллы в "стены" сокращать число градаций измеряемого признака там, где без этого можно прекрасно обойтись.
Вас, как заинтересованную студентку, уважаю, а по организации эксперимента дипломной работы, конечно же, есть вопросы, но понятно, что это, скорее, не к Вам, а к руководителю Ващей дипломной...