Архив психологического форума на "Флогистоне"

Вы просматриваете архив "психологического форума" за 2002-2008 год. Форум закрыт для написания в него новых записей. Новый форум - здесь.

Психологический форум на Флогистоне : 
U-критерий Манна-Уитни
Написано: Максим ()
Дата: January 20, 2004 05:06AM

Для компьютерной программы нужна формула для вычисления вероятности критерия Манна-Уитни. Везде даются ссылки только на таблицы, а там численность выборки стандартно не более 60 человек. Вышлите, пожалуйста, у кого есть формула или знаете где про это точно написано. e-mail: spbmax@mail.ru

[%sig%]

Настройки: ОтветитьЦитировать
А что за компьютерная программа?
Написано: Yuri ()
Дата: January 20, 2004 10:05PM

Интересно, Вы программу разрабатываете?

Я знаю, что, например, для значений второй выборки-большей по объему (N2), чем 20, U превращают в показатель z(z-score), используя следующую форумулу:

z=(U - N1*N2/2)/корень из ((N1*N2)*(N1+N2-1)/12)

N1 - кол-во наблюд. в меньшей группе
N2 - кол-во наблюд. в большей группе

Затем показатель z сравнивается с критическими значениями z

Настройки: ОтветитьЦитировать
Может быть полезна эта ссылка
Написано: Yuri ()
Дата: January 20, 2004 10:06PM


Настройки: ОтветитьЦитировать
квантили
Написано: SWR ()
Дата: January 21, 2004 04:13AM

Для вычисления этой вероятности требуется найти квантиль уровня p случайной величины кси с функцией распред. f кси(x), т.е. решить ур-ние f кси(x)=p. Проблема в том, что в ряде случаев это ур-ние может иметь несколько решений, а в ряде случаев - не иметь вовсе. Именно поэтому и были посчитаны таблицы, откуда можно взять готовое и существующее значение для нужного распред. и стандартно задаваемой вероятности.
Иными словами, будет существенно проще и эффективнее забить в программу таблицы smiling smiley

Что касается таблиц с объёмом выборки более 60 человек, то Вы, вероятно, смотрели не те таблицы. Непараметричские критерии считаются и на гораздо более низких n (что вызывает лично у меня глубокое омерзение и яростный протест).
Прямо по ссылке, которую дал Юрий, лежит искомая Вами таблица:
[jenpc.nstu.nsk.su]

[%sig%]

Настройки: ОтветитьЦитировать
прошу пардона
Написано: SWR ()
Дата: January 21, 2004 09:50PM

Перечитала вопрос и обнаружила, что спрашивали про n>60, а не меньше.
Тогда можно квантили для нормального распред. брать, а не для Вилкоксона.

ЗЫ. Вот ведь зараза - уже условный рефлекс, как у собаки Павлова, ворчать про недостаточные выборки sad smiley

[%sig%]

Настройки: ОтветитьЦитировать
Пытаюсь разобраться
Написано: Максим ()
Дата: January 21, 2004 11:12PM

Спасибо большое за ответ. Да, мы разрабатываем программу,
которая помогает выяснять территориальную специфику (например
школы, района, города и т.д.) по некоторым
социально-психологическим показателям. Вот туда и понадобился
алгоритм рассчета U-критерия и его достоверности.
Действительно, я тоже слышал, что распределение U-статистики при
численности выборки более 20-ти быстро сходится к нормальному.
Но проверить правомерность такого высказывания не было
возможности, да и выборки бывают разные, особенно если это
люди. Поэтому нужен алгоритм с формулами. Шаги алгоритма: 1.
Расчет U-критерия (с этим справлюсь, формула есть) 2. Расчет
достоверности критерия или p или альфа (вот этот шаг у меня
выпадает). 3. Сравнение с допустимым p=0,05 (ну тут уж я
справлюсь smiling smiley ). Если у Вас есть мысли по этому поводу,
пожалуйста, пишите либо в форум, либо сразу на spbmax@mail.ru
Буду очень признателен. Размер признательности и ее форма -
договоримся. С уважением. Максим.

[%sig%]

Настройки: ОтветитьЦитировать
И n>60 и n<60, заранее не известно
Написано: Максим ()
Дата: January 21, 2004 11:15PM

Спасибо большое за внимание к теме. Я действительно спрашивал
про n>60. Мне самому надоели исследования в пробирках, нужен
размах, что и собираемся делать. Я психолог, и в статистике
соображаю несколько хуже чем по специальности, а должен объяснить
программисту необходимые шаги для анализа выборок. Причем мы
заранее не знаем, сколько наблюдений (человек) пользователь
программы будет туда заносить. Может потребоваться сравнение 5
и 20, а может 400 и 1000 или другие соотношения. Если Вам не сложно,
пропишите, пожалуйста, алгоритм с формулами нахождения уровня p
или альфа (%) для известного значения U. Данно: значение U-критерия
(в книжках есть и посчитать ума хватает); численность 1-й и 2-й выборок.
Сравнивать полученное значение p буду с принятым 0,05. Если
удобнее, пишите на мэйл spbmax@mail.ru или в форум - мне
оттуда пересылается. Отблагодарю по возможности и по
потребностям - найдем их точки пересечения. С уважением и
благодарностью. Максим.

[%sig%]

Настройки: ОтветитьЦитировать
Совсем забыл.
Написано: Максим ()
Дата: January 21, 2004 11:30PM

При необходимости мой мэйл - spbmax@mail.ru

[%sig%]

Настройки: ОтветитьЦитировать
алгоритм
Написано: SWR ()
Дата: January 22, 2004 06:32AM

В принципе, по ссылке, которую бросил Юрий, алгоритм критерия расписан. Но для лучшего понимания можно рассмотреть конкретную задачу в числах. Обычно это помогает smiling smiley

Вот типичная задача.
Дано:
n1=40; n2=50 (обозначения 1 и 2 присваиваются выборкам таким образом, что n1<=n2);
U=1800;
Н0: F(x) = F(y);
H1: F(x) # F(y).
Зададим альфу=0.05.

Решение.
Открываем страничку [jenpc.nstu.nsk.su] и едем по ней вниз до надписи "Случай Б".
Для удобства я заменю обозначение квантили на Zкр.
Сначала посчитаем значение Ф(Zкр.)=(1-альфа)/2=(1-0.05)/2=0.475
Теперь откроем табличку функции Лапласа вот по ссылочке [jenpc.nstu.nsk.su] и найдём по ней Zкр. для Ф(Zкр.)=0.475 (т.е. искомую квантиль). Она равна 1.96.
Теперь снова посмотрим на страничку с надписью "Случай Б" и найдём на ней формулу (45). Подставим в эту формулу наши значения. Получим:
пси кр.н. = [(40+50+1)*40-1]/2 - 1.96*sqrt(40*50(40+50+1)/12),
что приблизительно равно 1578.
Это будет нашей нижней критической точкой.
Для нахождения верхней критической точки воспользуемся той же страничкой и найдём на ней формулу (43). Подставим в неё наши значения. Получим:
пси кр.в. = (40+50+1)*40-1578=2062.
Теперь подставим найденные критические точки в неравенство (44) с той же странички. Получим:
1578<1800<2062.
Поскольку неравенство верно, оснований отвергнуть нулевую гипотезу об однородности выборок нет.

Если же это неравенство окажется неверным, то самым примитивным алгоритмом подгонки альфы будет её повышение до тех пор, пока условие не станет верным. Естественно, можно этот алгоритм и оптимизировать, но в этом Ваш программист и сам разберётся.

[%sig%]

Настройки: ОтветитьЦитировать
Огромное спасибо.
Написано: Максим ()
Дата: January 22, 2004 03:56PM

Спасибо огромное за алгоритм. Насколько я понял, Zкр. для моих нужд будет константой равной 1,96. Отошлю Ваш ответ программисту, он должен разобраться (по крайней мере я понял). Чем могу быть Вам полезен, учитывая, что я психолог, но на этом мои таланты не заканчиваются? Очень хочу Вас отблагодарить, т.к. найденный алгоритм для меня очень важен. С уважением. Максим.

[%sig%]

Настройки: ОтветитьЦитировать
мыло
Написано: Максим ()
Дата: January 22, 2004 04:36PM

А лучше, пишите сразу на мэйл spbmax@fromru.com - кажется я забыл поставить галку напротив "Отправлять по указанному E-mail ответы на ваше сообщение." А в форуме я редко.

[%sig%]

Настройки: ОтветитьЦитировать
не за что smiling smiley
Написано: SWR ()
Дата: January 22, 2004 05:19PM

Этот алгоритм недостаточно засекречен, чтобы требовать награды за его разглашение smiling smiley
Но если Вы настаиваете на вознаграждении, то расскажите мне какой-нибудь свежий анекдот. Моё мыло correlation@land.ru

Да, если Вас интересует только альфа=0.05, то Zкр. будет константой, равной 1.96.

[%sig%]

Настройки: ОтветитьЦитировать
Может взять готовый статистический пакет?
Дата: January 27, 2004 07:38AM

Люблю москвичей за размах smiling smiley. Согласен с вопросом Юрия о том, пишите ли Вы компьютерную программу.

Просто сам я большой противник того, чтобы в психологические компьютерные программы включали какие-либо статистические методы. Как правило, получаются всякие побочные эффекты: у конечного пользователя м.б. свои запросы для обработки данных и желание присоединить первичные результаты к другим исследованиям, иногда (редко) включают устаревшие методы обработки. Правда, U-критерий будет жить вечно smiling smiley).

А программисты, они, порой, люди своеобразные... Им проще написать свою программу, чем воспользоваться замечательными статистическими пакетами. Чаще всего "математики" любят "Маткад" и "Матлаб".
Это те пакеты, от которых нормальный психолог "бежит"- там все формулы нужно загонять вручную с белого листа. "Математики" обычно упрямо путают факторный и дисперсионный анализы и, это точно, совсем не знают непараметрических методов.

Если Вы хотите провести психологическое исследование с размахом, возьмите мой любимый статистический пакет STATISTICA 5.5 (Есть правда, 6.0, и даже русифицированная, но я к 6.0 отношусь очень настороженно). Вам потребуется два-три дня на овладение этой программой (с руководством в руке и программой на компьютере) и Вы сможете посчитать абсолютно всё на выборке любого объема. Правда, полного руководства нет и никогда не будет, но этого и не надо. Усваиваешь общий принцип и спокойно работаешь.
В Москве, почему-то больше любят SPSS, но графики с интерфейсом, по сравнению с любой версией "STATISTICA", там просто аховые.
У Вас в МГУ сделали нормальную программу "Stadia", но там есть свои минусы: я пока-что не знаю, что она делает такого, что нельзя было бы посчитать в "СПСС-ке" или "Статистике", а продают её за кучу баксов. Понятное дело, что проще купить англоязычный компакт за 100-250 рублей и отрываться по полной.

Так вот, эти программы считают совершенно всё, что нужно в психологическом исследовании. "Статистика" может даже использовать нейросетевые методы. Единственное, с чем у статистических пакетов туго, так это с "Хи-квадратом" при сравнении двух эмпирических выборок. Но это случай редкий и его можно посчитать вручную.

Настройки: ОтветитьЦитировать
это не всегда целесообразно
Написано: SWR ()
Дата: January 27, 2004 11:22PM

%%"Математики" обычно упрямо путают факторный и дисперсионный анализы и, это точно, совсем не знают непараметрических методов.%%

Ну, может, "математики" и путают, и не знают, но математикам, поверьте, это не грозит smiling smiley)

Что касается использования готового софта для обработки, то всё вовсе не так однозначно.
Во-первых, абсолютно безразлично, в какой среде считать арифметику. Математические методы одинаковы и в SPSS, и в Statistic'e, и в Matlab'e (если формулы правильно задть), и в любом справочнике по матстату. Именно поэтому при использовании стандартного метода в работе положено указывать его название.
Во-вторых, стандартные пакеты прикладных программ считают отнюдь не совершенно всё, что нужно в психологическом исследовании. Особенно это касается случаев, когда статистические процедуры связаны со сложной первичной обработкой входных данных (напр. текста).
В-третьих, далеко не все уверенно чувствуют себя со статистическими программами, и иногда гораздо проще один раз запрограммировать обработку типового эксперимента, чем обучить всех, кто его проводит, пользованию Statistic'ой.

Настройки: ОтветитьЦитировать
Statistica хорошо, да не всегда
Написано: Максим ()
Дата: January 29, 2004 03:24PM

Ничего не имею против пакета программ Statistica. Правда если
подразумевается, что с этой программой будет работать более
одного человека - Вас, то придется таскать с собой и
Statistica, а в инсталяционном пакете эта гиря около 100 Mb.
В программе, которую делаем мы, будут работать другие люди и
как мне кажется не очень здорово присутствие Statistica в
инсталяционном пакете, т.к. не у всех она есть.
Это примерно тоже самое, что продавая кофемолку, вы
прилагаете к ней весь кухонный комбайн с мясорубкой блендером,
овощерезкой и еще кучей ерунды за те же деньги (видимо
аргументируя это тем, что самому досталось почти на халяву).
И при этом не имея никаких прав (я имею ввиду лицензионных).
Короче для решения небольшой локальной задачи инструмент лучше
специализировать для конкретной цели.

[%sig%]

Настройки: ОтветитьЦитировать
почти согласен smiling smiley)
Написано: Максим :^)) ()
Дата: January 29, 2004 11:15PM

Теперь понятно.
А то я было представил себя жителем города, где продают фотопленки только встроенными в такие дешевенькие пластмассовые фотоаппаратики, так что приходится их всё время разбирать, чтобы вставить плёнку в нормальный аппарат.

Настройки: ОтветитьЦитировать
Критерий Манна-Уитни
Написано: Настя ()
Дата: November 30, 2004 11:16PM

Ответ на этот вопрос можно очень подробно найти в книге Елены Сидоренко Метады математической обработки в психологии

Настройки: ОтветитьЦитировать
Критерий Манна- Уитни
Написано: Ася ()
Дата: April 21, 2006 07:41PM

Добрый день всем.
В написании диплома, вернее его эмпирической части, необходимо сделать критерий Манна- Уитни.
Открыла учебник Елены Сидаренко "Методы математической обработки в психологии" и что называется "смотрю в книгу- вижу фигу!".
Если кто разбирается в этом критерии, прошу помощи!!!!
Если у кого есть возможность сделать этот критерий за дополнительную плату - напишите мне на E-mail!
Вдруг найдутся те, кто любит матстатистику!

Настройки: ОтветитьЦитировать
книга
Написано: Руслан ()
Дата: April 27, 2006 02:07PM

Смотрите книгу Стентона Гланца "Медико-Биологическая Статистика"

Настройки: ОтветитьЦитировать


© Copyright "Флогистон: Психология из первых рук" 1998-2008. О проекте По вопросам сотрудничества обращайтесь на адрес
Rambler top 100 Яндекс цитирования Обновления сайта в формате rss