Видеолекция 2. Числовые характеристики дискретных случайных величин
Следующая лекция по теме "Случайные величины" – "Числовые характеристики случайных величин". Давайте поймем, что полностью случайную величину задает ее закон распределения. Для дискретных случайных величин мы рассмотрели ряд распределений, но нам не всегда нужно знать полное описание случайной величины, иногда достаточно знать только какие-то ее числовые характеристики, какие-то ее особенности. Первой такой особенностью является ее среднее значение, то есть если посмотреть задачи, которые в дальнейшем вам будут встречаться в статистике, да и в принципе в школе вы рассматривали задачи из реальной жизни, то очень часто от вас просят найти среднее значение, а сколько будет в среднем и так далее. Вот это все касается такой числовой характеристики случайной величины как математическое ожидание.
Математическое ожидание - это не что иное, как среднее значение случайной величины, обозначается Mx = x1p1 + x2p2 + …+xnpn. Для дискретных случайных величин это считается как средневзвешенное, где коэффициенты - это вероятности, и у каждого значения к своим коэффициентам будет его вероятность. Рассмотрим ситуацию, когда проводится n опытов, n1 раз случайная величина приняла значение x1, n2 раз - x2 и так далее, nk приняла значение xk. Тогда ni на n - это как раз будут вероятности того, что случайная величина приняла значения xi, и мы увидим, что математическое ожидание - это ничто иное, как среднее взвешенное, или просто среднее арифметическое.
Рассмотрим пример. Пусть один раз бросается игральная кость, и требуется найти математическое ожидание числа выпадений шестёрки. Ряд распределения был составлен нами ранее, тогда математическое ожидание будет равно 1/6. Не всегда математическое ожидание целочисленной случайной величины также будет целочисленным.
Рассмотрим другой пример. Пусть игральная кость подбрасывается трижды и по-прежнему нас интересует среднее число выпадения шестерки. Ряд распределения нами был составлен на предыдущей лекции, он приведен сейчас на слайде (см. видео), тогда математическое ожидание можно вычислить по формуле и оно будет равно 1/2. Заметьте интересную особенность, если мы возьмем, что игральная кость подбрасывается три раза по 1/6, то мы как раз получим 1/2. Интересно, закономерно это или получилось у нас случайно? Давайте смотреть дальше.
Рассмотрим третий пример. Сколько же в среднем нужно бросить игральную кость до первого выпадения шестерки? Рассмотрим следующий ряд распределения, который также был нами построен на предыдущем занятии (см. видео). Математическое ожидание будет равно сумме ряда. Заметим, что если мы вместо 1/6 подставим x, то у нас будет ряд вида: Σ k∙5k-1 /6k,где k меняется от единицы до бесконечности. Сумму данного ряда несложно получить путем интегрирования, то есть взять геометрическую прогрессию xк, где 1<k<∞ и продифференцировать. Тогда после того, как мы подставим 1/6 вместо x обратно, мы получим, что значение будет равно 6. Попробуйте данные действия проделать самостоятельно.
Еще одно понятие, которое хочется ввести, это независимость случайных величин. Мы уже говорили, что события независимы тогда и только тогда, когда вероятность одного не меняется в зависимости от того произошло другое или нет. Аналогично вводится независимость случайных величин. Две случайные величины независимы, если закон распределения одной из них не изменяется в зависимости от того, какое значение приняла вторая случайная величина. То есть, например, вторая случайная величина может принимать значения 3, 5 и 7. Мы можем рассмотреть закон распределения первой случайной величины, если вторая приняла значение 3, если вторая приняла значение 5, и если вторая приняла значение 7. Если во всех этих трех случаях мы получим одно и то же, мы можем считать, что две случайные величины являются независимыми, при этом мы можем рассмотреть как первую относительно второй, так и вторую относительно первой, это будет одно и то же. То есть мы можем говорить, что будут независимы все случайные события вида (a ≤ x < b) и (c ≤ η <d), об этом мы с вами поговорим в теме «Системы случайных величин» чуть подробнее.
Теперь рассмотрим свойства математического ожидания. Многие свойства достаточно легко доказываются, поэтому сейчас посмотрим лишь идею доказательства, а сами доказательства попробуйте придумать сами, если же возникнут затруднения, то обратитесь к справочнику, там эти доказательства приведены.
1) Mc = c, где c = const (математическое ожидание константы равно самой этой константе). Действительно, если случайная величина постоянна, то вероятность того, что примет значение c равна единице, а значит, математическое ожидание равно c умножить на 1.
2) M[cx] = cMx (математическое ожидание величины, умноженной на константу, равно константе за пределами, то есть константу из мат. ожидания можно выносить). Опять же это достаточно логичное условие, попробуйте взять формулу и подставить случайно величину, где все значения увеличены в c раз.
3) M[x+c] = Mx + c (если к случайной величине прибавить некоторую константу, то есть сдвинуть, тогда ее мат. ожидание также сдвинется на константу). Опять же у нас будет случайная величина, где вероятности те же самые x + c, а все значения увеличены на величину c. Проделайте эти вычисления руками и получите результат. Обобщим данные свойства, вместо c подставим другую случайную величину.
4) M[x+η] = Mx + Mη (мат. ожидание суммы случайных величин будет равно сумме мат. ожиданий). Здесь хорошо рассматривать данное свойство тогда, когда вы знаете совместную функцию распределения, поэтому оставим данное свойство без доказательства. Также без доказательства оставим и последнее свойство.
5) M[x∙η] = Mx∙Mη, если x и η -независимы (мат. ожидание произведения также может быть равно произведению мат. ожиданий, но только в случае, если случайные величины независимы). В общем случае мы это утверждать не можем, то есть это не всегда верно. Попробуйте придумать пример двух случайных величин, для которых это неправда (то есть величины должны быть зависимы).
И еще одна задача, которую хотелось бы предложить. Пусть 10 игральных костей подбрасываются одновременно. При этом кости, на которых выпали шестерки откладываются, а остальные бросаются еще раз. Так процесс происходит пока на всех костях не выпадут шестерки. То есть мы откладываем те кости, на которых выпали шестерки и так пока у нас не останется костей. Вопрос: сколько в среднем раз будет подброшено костей (ни сколько в среднем будет сделано подбрасываний, а именно, сколько в среднем раз, будет подброшено костей). Подумайте над этой задачей, информация, которая вам уже была дана, более чем достаточно для ее решения.
Далее, не всегда среднего значения достаточно для характеристики случайной величины, то есть у разных случайных величин среднее значение может быть одинаковым. Поэтому кроме центра случайной величины, вводится также понятие рассеянья случайной величины. Для этого давайте рассмотрим понятие центрированной случайной величины. Случайная величина x минус ее мат. ожидание будет центрированной. Это означает, что мат. ожидание такой величины всегда равно нулю. Но, если мы будем рассматривать вот эту центрированную случайную величину, то она нам никакой хорошей информации не даст, поэтому рассматривают ее степени. Самая распространенная - это вторая степень данной величины, то есть мы рассматриваем мат. ожидание квадрата центрированной случайной величины и называем это дисперсией.
По-другому, дисперсия - это средний квадрат отклонения случайной величины от ее математического ожидания. Dx = M[(x - Mx)2] - вот эта величина позволяет нам определить, насколько сильно разбросаны значения случайной величины относительно ее центра. Иногда удобно считать дисперсию не по формуле мат. ожидания квадрата отклонения, а по другой формуле. Давайте ее выведем. Если мы раскроем скобки, то получим более сложное выражение: M[x2 -2∙x∙Mx+(Mx)2]. Так как мы уже знаем, что сумма мат. ожиданий равна мат. ожиданию суммы, то разделим на части: Mx2- M[2∙x∙Mx]+M[(Mx)2]. Далее вынесем все константы из мат. ожиданий и приведем подобные слагаемые: Mx2 – 2Mx∙Mx + (Mx)2. Заметим, что первое слагаемое это мат. ожидание квадрата случайной величины, а следующие два слагаемых зависят от квадрата мат. ожидания. Получим, что дисперсия случайной величины может быть вычислена как мат. ожидание квадрата минус квадрат мат. ожидания: Mx2 – (Mx)2. Данная формула очень удобна именно при ручных вычислениях, то есть, если вы вычисляете на компьютере значение, то удобно пользоваться определением, если же вручную, то чаще используется именно вторая формула. Также данная формула удобна для непрерывных случайных величин, об этом мы поговорим позднее.
Рассмотрим пример. Пусть игральная кость подбрасывается один раз. Тогда дисперсия числа выпадения шестерки будет вычислена по формуле (см. видео), то есть сначала вычислим мат. ожидание квадрата, а потом уже подставим во вторую формулу. Предлагаю воспользоваться первой формулой самостоятельно и проверить, что вы получите то же самое значение.
Рассмотрим пример с тремя подбрасываниями игральной кости. Ряд распределения мат. ожидания мы уже получили ранее. Мат. ожидание квадрата можно посчитать по формуле (см. видео): Mx2 = 2/3, тогда дисперсия будет равна 5/12. Опять же можно заметить, что если при одном подбрасывании дисперсия равна 5/36, то при трех подбрасываниях дисперсия в 3 раза больше. Это тоже не случайно, об этом нам будут говорить свойства дисперсии, так как у нас здесь опыты будут независимы, это важно.
Рассмотрим свойства дисперсии.
1) Dc = 0, где с = const (дисперсия константы равна нулю). В действительности, если величина случайно принимает только одно значение, то у нее нет никакого разброса, она всегда равна своему мат. ожиданию, а значит, ее рассеяние ноль. Преобразования проведите самостоятельно.
2) D[cx] = c2Dx (дисперсия случайной величины умноженной на константу равна квадрату константы на дисперсию самой случайной величины). Обратите внимание, если из мат. ожидания константа выносится просто, то есть дисперсия из квадрата, это все потому, что дисперсия - это квадрат мат. ожидания. Достаточно просто подставить формулу дисперсии и воспользоваться свойствами мат. ожидания.
3) D[x + c] = Dx. Третье свойство также легко доказать, подставив в исходную формулу определения и воспользовавшись свойствами мат. ожидания. То есть если мы случайную величину сдвинем на какое-то число, то ее дисперсия не изменится, что тоже достаточно логично. Последнее свойство верно только для независимых случайных величин, то есть дисперсия суммы не всегда равна сумме дисперсий, но если величины независимы, то это правда и это очень часто помогает.
Например, мы это заметили в предыдущем случае, когда рассматривали подбрасывании игральных костей. Дисперсия показывает рассеяние, но если мы посчитаем единицы, то заметим, что если случайная величина измерялась в сантиметрах, то дисперсия будет измеряться в сантиметрах в квадрате, что достаточно неудобно. Поэтому вводят такую величину как среднеквадратическое отклонение, это просто корень из дисперсии. То есть, мы приводим единицы к единицам, в которых измеряется случайная величина, тогда среднеквадратическое отклонение очень хорошо нам показывает разброс случайной величины.
Также существует правило трех σ (сигм), которая говорит нам о том, что практически
все значения случайной величины находятся в промежутке (m - 3σ, m + 3σ), то есть оценка очень высока для
разных распределений. Конечно, вероятность попадания случайной величины на
данный промежуток будет разная, но всегда она будет очень высокой.