Лабораторная работа 1 (видео). Сравнение средних выборочных совокупностей при известных дисперсиях генеральных совокупностей
Раздел «Проверка статистических гипотез». Тема «Сравнение средних выборочной совокупности при известных дисперсиях генеральной совокупности».
Предлагаю мини-тест. Вопрос первый. Статистические гипотезы условно подразделяются на следующие типы… Даны варианты ответов. Выберите верный ответ. Вопрос второй. Статистическая гипотеза о сравнении средних выборочных совокупностей, если известны дисперсии генеральных совокупностей, является… Варианты ответов: непараметрической, нулевой, параметрической, альтернативной. Выберите верный вариант ответа. Вопрос третий. Статистические гипотезы о значениях параметров известного распределения случайной величины называются … Варианты ответов: независимые, параметрические, не параметрические, случайные. Выберите верный вариант ответа.
Проверим ваши ответы. Вопрос первый. Верный вариант ответа номер 1. Вопрос второй. Верный вариант ответа под цифрой 3. Вопрос третий. Верный вариант ответа под цифрой два.
Рассмотрим алгоритм проверки гипотезы о равенстве средних с известными дисперсиями. Шаг первый. Необходимо выбрать уровень значимости альфа. Наиболее часто используемые значения - 0,01 или 1%, 0,05, что соответствует 5%, и 0,1, что соответствует 10 процентам ошибки. Далее необходимо сформулировать гипотезы. H0 - нулевая гипотеза «Генеральные средние равны». Н1 может быть трех видов. Наиболее часто используемое «Генеральные средние не равны». Второй шаг. Необходимо найти эмпирическое значение критерия. Формула на экране. Здесь даны выборочные средние для нормально распределенных переменных х1 и х2 соответственно, D1 и D2 - это известные генеральные дисперсии для х1 и х2 соответственно. Шаг третий. Необходимо найти критическое значение критерия. Для этого заходим в Мастер функций. Выбираем категорию Статистические и функцию НОРМ.СТ.ОПР. Здесь в окно Вероятность вносим значение p/2+0,5. Здесь приведен пример, когда надежность равна 0,95, то есть уровень значимости - 0,05. Последний шаг алгоритма: необходимо сравнить эмпирическое и критическое значения критерия. Если эмпирическое значение меньше критического, то на уровне значимости альфа принимается нулевая гипотеза, иначе можем принять альтернативную гипотезу.
В математической статистике, хочу обратить внимание, правило вывода альтернативной гипотезы - более строгое, чем предполагается при решении задач в биологии в медицине при использовании соответствующих критериев о средних.
Правило вывода следующее: если с надежностью 0,95, то есть с уровнем значимости 0,05, получается, что эмпирическое значение больше либо равно z критического, то рекомендуется повысить надежность, то есть взять, например, 0,99, то есть альфа будет составлять 0,01, и при этих условиях еще раз проверить критерий. Если в этом случае получится такое же неравенство, то можно с надежностью 95% (или с ошибкой 5%) утверждать, что может быть принята гипотеза Н1, то есть альтернативная.
Рассмотрим пример. В результате измерения роста 70 случайным образом отобранных студентов первого курса и 80 студентов второго курса были получены следующие результаты. Известен средний рост, то есть выборочное среднее. При этом были известны оценки дисперсии роста, то есть были известны дисперсии генеральных совокупностей. Необходимо выяснить, можно ли на основании полученных результатов утверждать о значимом различии средних значений роста студентов первого и второго курсов, представляющих генеральные совокупности, на уровне значимости альфа=0,05.
Нулевая гипотеза: «Различие средних значений роста студентов первого и второго курса статистически не значимо». Альтернативная гипотеза – статистически значимо.
Найдем эмпирическое значение критерия, подставив в формулу среднее значение и генеральную дисперсию. Эмпирическое значение равно 13,23. Далее найдем критическое значение критерия, которое вычисляется с помощью статистической функции НОРМ.СТ.ОПР. Здесь оно примерно равно 1,96. Сравним эмпирическое и критическое значения. Так как 13,23>1,96, то на уровне значимости 0,05 отвергаем нулевую гипотезу и можем сделать вывод о возможной значимости экспериментально наблюдаемого различия среднего роста студентов первого и второго курсов генеральной совокупности.
Для вычисления значений этого критерия можно было использовать Пакет анализа. В панели инструментов Данные выбрать Анализ данных и процедуру Двухвыборочный z-Тест для средних. Использовали бы Пакет анализа в том случае, если бы были представлены данные, собранные по первому курсу и, соответственно, по второму курсу. Тогда бы интервал переменной 1 это ссылки на ячейки со значениями первой выборочной совокупности. Интервал переменной два - ссылка на значения второй совокупности. Гипотетическое среднее равно 0. То есть Н0 изначально звучит как «Генеральные средние равны», значит их разность равна нулю Дисперсия переменной 1 известна, дисперсия переменной 2 тоже известна. Не забудьте поставить галочку в Метках, если есть заголовки у ваших данных. Альфа автоматически будет выбираться равным 0,05, то есть надежность наших рассуждений будет составлять 95 %, либо вы можете выбрать свой уровень значимости. Выходной интервал – выбирается ячейка, куда будут выводиться наши результаты.
Предлагаю задачи для самостоятельного решения.
Задача 1. Обратите внимание, что здесь даны дисперсии 5 квадратных мм и 7 квадратных мм, то есть по сути даны ошибки, соответствующие первому и второму станкам. Это не что иное как генеральные дисперсии для первой и второй совокупностей.
Задача 2. Здесь обратите внимание, даны две совокупности объемом по 100 объектов, и когда будете вносить данные, учтите повторяемость каждого значения.
Желаю вам успешного решения. Спасибо за внимание.