Лабораторная работа (видео). Основные понятия математической статистики
Раздел: «Основы математической статистики». Тема: «Основные понятия математической статистики».
Предлагаю мини-тест. Вопрос 1. Вся совокупность объектов, характеризующая изучаемый статистический признак, называется ... Варианты ответов: 1) выборочной совокупностью; 2) генеральной совокупностью; 3) случайной величиной; 4) совокупностью. Выберите верный ответ. Вопрос 2. Выборочная совокупность это - … Варианты ответов: 1) случайным образом отобранная часть генеральной совокупности; 2) совокупность объектов, характеризующая изучаемый статистический признак; 3) все значения случайной величины; 4) множество чисел. Выберите верный ответ. Вопрос 3. Виды графиков для выборочной совокупности … Варианты ответов: 1) полигон; 2)гистограмма; 3) кумулята; 4) все перечисленные. Выберите ответ, который, по вашему мнению, верный.
Проверим ваши ответы: вопрос 1 – верный ответ 2, вопрос 2 – верный ответ 1, вопрос 3 – верный ответ 4, и здесь можно добавить еще один из графиков, который может быть использован для выборочной совокупности - это огива.
Выборочная функция распределения может быть построена в Microsoft Excel, используя в Ммастере функций категорию Статистические функцию ЧАСТОТА(массив_данных, массив_интервалов), которая позволяет вычислить частоты появления случайной величины в интервалах значений и выводит эти частоты в виде массива данных.
Графическое представление выборочной совокупности может быть выполнено с помощью Пакета анализа данных и процедуры Гистограмма. Параметры гистограммы: Входной интервал - диапазон исследуемых данных; Интервал карманов - это диапазон интервалов; Выходной интервал; Интегральный процент; Вывод графика.
Пример. Построить эмпирическое распределение массы студентов в килограммах для следующей выборки: 64, 57, 63, 62, 58, 61, 63, 70, 60, 61,65, 62, 62, 40, 64, 61, 59, 59, 63, 61. Предлагаю внести эти данные в Microsoft Excel, диапазон интервалов – возьмем интервал от 40 до 70, так как наименьшее значение 40, а максимальное – 70, с шагом 5. Вбиваем эти данные. Сейчас будем находить абсолютные чистоты. Для этого выберем ячейку C2, зайдем в «Мастер функций», выберем функцию категории «Статистические», затем выберем «ЧАСТОТА». Выделим массив данных - это данные первого столбца наблюдения, массив интервалов - это значения от B2 по B8. Получили абсолютную частоту для первого интервала. Сейчас выделим диапазон, где будут наши частоты выведены. Аактивируем функциональную клавишу F2, то есть активируем функцию «Частота», дальше нажмем одновременно три клавиши Ctrl, Shift, Enter. Значения, которые мы получили, - это и есть наши абсолютные частоты. Сейчас проверим, верные ли получились вычисления. Для этого выберем «Панель инструментов», затем нажмем на «Авто сумму». Получившееся значение – 20, действительно, диапазон наших данных 20. Сейчас построим относительные частоты. Для этого выберем ячейку D2, возьмем значение абсолютной чистоты C2, и поделим на C9. Зафиксируем. Получившееся первое значение - это и есть наша первая относительная частота, далее мы протянем. Соответственно, можем также проверить. Для этого в Панели инструментов нажимаем «Авто сумму», и действительно, мы видим, что у нас сумма относительно частот – единица.
Теперь подсчитаем накопленные частоты. Для этого первое значение T2 мы копируем в ячейку E2, а далее мы суммируем значение ячейки E2 со значением ячейки D3, далее мы протягиваем. Накопленные частоты в итоге в сумме будут давать единицу, то есть это подтверждает, что мы все верно вычислили.
Сейчас построим графические представления нашей выборочной совокупности. Для этого заходим в «Панель инструментов» – «Вставка» – «Диаграммы». И вот, первая диаграмма - это полигон. Обратите внимание, что мы можем заполнить название осей, подписать название диаграмм, также можем подписать данные, предел погрешности и так далее. Можем изменить тип диаграммы, например, выбрать гистограмму. Аналогично можем ввести название осей как горизонтально, так и вертикально, и, конечно же, название диаграммы.
Сейчас в панели инструментов выберем Данные, «Пакет анализа данных», выберем «Гистограмму». Входной интервал выберем первый столбец данных, интервал карманов - это столбец 2, здесь ставим галочку в метке, потому что есть заголовки у каждого из столбцов, и выходной интервал давайте поставим ячейку O1. Мы получили соответственно частоты. Это второй способ расчета частот для выделенных соответственно интервалов. Чтобы у нас выводился график, конечно же, не забывайте поставить галочку «Вывод графика». Обратите внимание, что получившаяся гистограмма абсолютно идентична гистограмме, построенной с помощью вставки диаграммы, только здесь у нас уже оси и название диаграммы подписаны.
Также можно построить диаграмму относительных и накопленных частот. Для этого мы также заходим «Вставка» – «Диаграммы». Здесь необходимо выбрать соответственно диапазон других данных, то есть, если мы будем брать относительные частоты, то это диапазон от D2 по D8, если хотим взять накопленные частоты, то это E2 и E8. Значит, для этого выбираем диапазон данных для диаграммы E1, E8, дальше изменяем диапазон подписей осей B2, B8 и изменяем ряд, то есть значения D2, D8, далее нажимаем кнопку «Ок». Тогда мы получим такую диаграмму (см. видео), где график синего цвета - это график накопленных частот, красного цвета - это график, относящийся к относительным частотам. Если мы хотим поменять график относительно частот, здесь он представлен в виде полигона, а мы захотим представить в виде гистограммы, то мы нажимаем правую кнопку мыши и выбираем изменить тип диаграммы. Изменяя тип диаграммы, выбираем гистограммы, тогда соответственно у нас вместо полигона появляется гистограмма, соответствующая относительным частотам.
Предлагаем задач для самостоятельного решения.
Задача 1. В начальной школе в одном из классов были получены следующие данные о массе мальчиков: 21,8; 24; 21,8; 20; 21,8; 20; 19,3; 20,8; 19,3; 23,8; 20; 24; 20; 19,3; 20; 21,8; 20,8; 20,8; 23,8; 23,8; 20; 20,8; 24; 24,5; 23,8; 23,8; 20,8; 20; 24; 24; 24,5; 19,3; 20,8; 20; 20,8; 24,5; 20; 20. Построить выборочные функции распределения. Построить полигон.
Задача 2. Результаты измерения роста случайно отобранных 100 студентов представлены в виде таблицы данных. Рост в см.: 154-158, 158-162, 162-166, 166-170, 170-174, 174-178, 178-182. Число студентов соответственно: 10, 14, 26, 28, 12, 8, 2. Построить гистограмму.
Желаем вам успешного решения. Спасибо за внимание!