Видеолекция 1. Система случайных величин (часть 1)

Просмотреть

 


Лекция «Система случайных величин». Если на предыдущих занятиях мы смотрели случайные величины по отдельности, то сегодня мы посмотрим случайные величины в совокупности, то есть будем рассматривать сразу не одну, а несколько случайных величин.

В рамках данного курса мы ограничимся системами из двух случайных величин. Периодически будем говорить о том, что же изменится, если взять вместо двух случайных величин большее количество.

Системой случайных величин называется 2, 3 и так далее случайные величины, для которых задается совместный закон распределения. Законом распределения системы случайных величин называется некоторая функция, которая каждой паре либо каждому набору значений случайных величин ставят в соответствие некоторую вероятность, то есть число из промежутка [0, 1]. При этом зависимости от того, у нас система дискретная или непрерывная, или смешанная, у нас будет задаваться каждому значению либо вероятность, либо плотность вероятности, как и в случае одномерных случайных величин. А если обе случайных величины являются дискретными, то закон распределения системы удобно задавать матрицы или таблицы распределения.

Ограничимся пока система из двух случайных величин. Матрица задается следующим образом: с в столбец выписываются все значения одной случайной величины, в нашем случае это значения случайной величины ξ x1, x2 и так далее xm. В строчку выписываются значения другой случайной величины η – у1, у2 и так далее уn. На пересечении строки и столбца будет стоять вероятность того, что появится соответствующая пара значений случайных величин. Так как эта вероятность, то все значения рij будут лежать в промежутке от нуля до единицы. При этом, так как никакая другая пара, кроме указанных в таблице, появиться не может, то сумма всех вероятностей будет равна 1. Также, как и в одномерном случае, это называется условием нормировки.

Частные распределения. В некоторых случаях нам нужно узнать не совместное распределение, а по таблице понять, а какое же распределение имеет, например, случайная величина ξ? Что мы можем для этого сделать? То есть нам нужно найти вероятности того, что появятся некоторые конкретное значение случайной величины ξ, вне зависимости от того, какое значение примет вторая случайная величина η. Можно записать вероятность события ξ= xi так. (см. видео). Достоверное событие представим, как сумму событий (см. видео). Вот эта сумма является полной группой несовместных событий, то есть ее сумма является достоверным событием. При этом все события попарно несовместны, а значит, если раскрыть скобки, то у нас также будет группа попарно несовместных событий, которые в сумме будут давать событие ξ=xi. Далее. Так как у нас будет вероятность суммы попарно несовместных событий, то вероятность этой суммы можно представить, как сумму вероятностей, каждая из которых равна рij, где j – это, соответственно, номер значения величины η. Таким образом, частное распределение величины ξ – это суммы, в нашем случае по строчкам, то есть вероятность того, что ξ примет значение x1 – это сумма элементов первой строки, вероятность того, что ξ примет значение x2 – сумма второй строки и так далее. Стоит заметить, что сумма всей таблицы равна 1, а значит, и сумма в нашем ряду также будет равна 1. Если нам понадобится посчитать частное распределение случайной величины η, то тогда необходимо будет просуммировать столбцы.

Если рассматривается 3 и более случайных величин, тогда у нас будет уже таблица не двумерная, а трехмерная и более. В ней мы фиксируем значение некоторой случайной величины, и в зависимости от того, какие значения примут остальные случайные величины, считаем сумму. Аналогично мы можем посчитать частное распределение для величины η, приведено на слайде.

Совместная функция распределения. Из одномерного случая мы уже знаем, что ряд распределения доступен только для дискретных случайных величин. В нашем случае для систем 2 дискретных случайных величин. Если же случайные величины заранее неизвестны, то мы рассматриваем всегда самый общий способ задания – с помощью совместной функции распределения. Совместная функция распределения определяется как вероятность того, что первая величина будет меньше, чем значение x, а вторая – меньше, чем значение y. Аналогично, если у нас система из более чем двух случайных величин, то это будет произведение n соответствующих событий (то есть, если n случайных величин, то в произведении будет n множителей). На рисунке приведена геометрическая интерпретация данного факта, то есть, если (x, y) – это точка на двумерной плоскости, то мы получаем, что функция распределения – это вероятность попадания в заштрихованный квадрат. Эта геометрическая интерпретация нам поможет в дальнейшем обосновывать некоторые утверждения.

Рассмотрим свойства совместной функции распределения. Первое свойство довольно очевидно. Так как по определению функция распределения – это вероятность, то ее значения могут лежать только в диапазоне [0, 1]. При этом легко показать, также, как и в одномерном случае, что если мы параметр x устремим к минус бесконечности, то значение функции распределения устремится к 0. При чем здесь неважно, какое значение принимает параметр у, то есть какой бы параметр мы не устремили, также получим 0. Но, если же мы только один параметр устремим в плюс бесконечность, мы 1 не получим. К 1 будет стремиться функция распределения только в случае, если оба параметра стремятся к плюс бесконечности. На слайде приведены доказательства этих утверждений.

Если же к бесконечности устремить только один параметр, то есть, например, рассмотреть предел нашей функции при x, стремящемся к плюс бесконечности, тогда мы заметим, что это будет вероятность того, что ξ меньше плюс бесконечности, а η меньше y. Первая скобка представляет собой достоверное событие, а мы знаем, что умножение на достоверное событие событие не меняет, а значит, и то вероятность того, что η меньше y. Это уже по определению частная функция распределения случайной величины η. То есть в случае использования функции распределения частные распределения будут получены как пределы по противоположной, наоборот, координате.

Также можно заметить, что функция f(x, у) – не убывающая по обоим аргументам. Это связано с тем, что вероятность не отрицательная и при увеличении того или иного аргумента ее значение будет увеличиваться.

Еще одним свойством функция распределения можно считать вероятность попадания в некоторый заданный прямоугольник. Вот здесь сразу же я остановлюсь и оговорюсь. Если мы используем функцию распределения, то вероятность попадания в произвольную область считать неудобно, поэтому здесь считаем вероятность попадания только в прямоугольник. То есть пусть у нас прямоугольник по оси абсцисс ограничен точками a и b, по оси ординат – точками c и d, то есть величина ξ принимает значение в промежутке от а до b, а величина η в промежутке от c до d. Вот это приведено на слайде.

Давайте поймем, как посчитать вероятность попадания в этот прямоугольник. С одной стороны, f(b, d) – это вероятность попадания в заштрихованный квадрант с вершиной в точке (b, d). Из этого квадранта мы уберем квадрант с вершиной в точке (a, d). Мы получим бесконечную вниз полосу, то есть cверху она ограничена точкой d, а вниз она будет бесконечна. Чтобы получить прямоугольник, нам нужно убрать бесконечную полосу, у которой верхнее значение в точке с, соответственно, как получить вероятность попадания в эту полосу. А это не что иное, как разница между вероятностью попадания в квадрант с вершиной в точке (b, c) и квадрант вершиной в точке (а, с). Соответственно, вычитая из одного другое и раскрывая скобки, получим формулу, приведенную на слайде.

Хорошо, мы уже поняли, что не так удобно пользоваться функцией распределения, то есть мы можем, например, если нам нужна какая-то вероятность, посчитать только вероятность попадания в некоторый прямоугольник. Поэтому давайте хотя бы в каких-то случаях введем более удобное средство. В одномерном случае этим средством была плотность распределения. В двумерном случае, даже если обе случайные личные непрерывны, не всегда можем рассматривать плотность распределения. Поэтому рассмотрим следующее определение. Система случайных величин непрерывна, если ее функция распределения непрерывна, дифференцируема по любому из аргументов, при этом существуют смешанные частные производные второго порядка. Эти частные производные также должны быть отличны от 0 в некоторые области. Важно, что недостаточно требовать непрерывность обеих случайных величин, потому что система, например, ξ и 1–ξ, где ξ это непрерывная случайная величина, непрерывной являться не будет. То есть ее функция распределения будет отлична от 0 только на прямой. Соответственно, вне этой прямой она будет равна 0, поэтому мы не можем говорить, что эта функция дифференцируема по обоим аргументам. Таким образом, не всегда система двух непрерывных случайных величин является непрерывной системой.

Мы будем рассматривать только непрерывные системы двух случайных величин. Для них можно рассмотреть совместную плотность, которая как раз и определяется через смешанную производную второго порядка.

Очевидно, что так как плотность распределения является смешанной производной, то функцию распределения по плотности можно получить через двойной интеграл. То есть имеем повторный интеграл, где оба параметра меняются в границах от минус бесконечности до текущего значения.

Второе очевидное свойство, заключается в том, что, так как у нас функция f(х, у) была непрерывна по обоим аргументам, то функция плотности f будет неотрицательна. Также, как и в одномерном случае. Обратите внимание, очень похоже на свойства одномерного варианта. Условия нормировки также имеет место быть для многомерной плотности распределения (для совместной плотности распределения). То есть, если мы посмотрим объем под поверхностью распределения (а f(x,y) в двумерном случае будет образовывать некоторую поверхность), то этот объем обязательно должен быть равен 1.

Частные распределения. Введем следующий момент: f(x, у) задает поверхность распределения, а нам надо рассмотреть лишь какую-то конкретную координату. Зафиксируем значение x, тогда нам нужно найти вероятность того, что случайная величина ξ примет это значение, а значит, случайная величина η может принять любое значение из действительных чисел из тех, которые она может принимать, Поэтому, для того, чтобы найти плотность распределения, достаточно проинтегрировать совместную плотность по всей действительной оси. Попробуйте доказать этот факт самостоятельно или посмотреть в методических указаниях.

Аналогично, частное распределение величины η будет вычисляться как интеграл от совместной плотности распределения. Разница лишь будет в том, по какой переменной считать. Запомнить это просто. Смотрите, какая переменная вам нужна, а от какой нужно избавиться. Нужно интегрировать именно по той переменой, от которой нужно избавиться.

Если мы рассматриваем некоторую случайную и произвольную область, то достаточно легко считается вероятность попадания в эту область. Если мы эту область разобьем на множество маленьких прямоугольников и вспомним вероятность попадания в прямоугольную область через функцию распределения, при этом вспомним, что функция распределения – это двойной интеграл от плотности распределения на данном прямоугольнике, и все это просуммируем, то мы получим двойной интеграл от плотности распределения на нашей сложной области D. Понятно, что если разбиение сколь угодно уменьшать, то оно, в итоге, будет стремиться к области D. Четкое доказательство я не привожу, средствами математического анализа это все хорошо делается. Попробуйте сделать это самостоятельно.

Важное понятие в системах случайных величин – это независимость случайных величин. В следующей лекции мы с вами поговорим о видах связей между двумя случайными величинами. Так вот первое, что хочется сказать, это независимость. Мы говорили, что два случайных события независимы, если произошло или не произошло одно, никак не влияет на то, произошло или не произошло другое. Определение независимости для случайных величин будет очень похоже. Рассмотрим два эквивалентных определения. Первое определение звучит достаточно сложно. Оно похоже на случайное событие. Случайные величины независимы тогда, когда для любых чисел a, b, c и d верно, что события a ≤ ξ < b и c ≤ η < d будут независимы. То есть мы дали определение независимости случайных величин через определение независимости случайных событий.

Но этим определением неудобно пользоваться на практике, поэтому дадим второе определение. Случайные величины независимы, если их совместная функция распределения является произведением частных функций распределения. Это правда, доказывать мы не будем, что данное определение эквивалентно. Тем, кому интересно, попробуйте сделать самостоятельно.

Но тоже не всегда удобно работать с функцией, если продифференцировать по обеим координатам. Если система абсолютно непрерывна, то получится, что совместная плотность распределения также окажется равной произведению частых плотностей. Для дискретных же случайных величин мы получим, что каждое значение, каждая вероятность пары будет равна произведению соответствующих частных вероятностей. Для проверки факта, является ли система двух случайных величин независимой, нужно посмотреть на ее плотность распределения, найти частные распределения и проверить, является ли произведение частных распределений совместной плотностью.

Если же обе случайные величины дискретные, то нужно построить совместную таблицу распределения, посчитать частные распределения и проверить, что в каждой клеточке таблицы записано произведение соответствующих частных. Если же есть хотя бы одна клетка таблицы, где произведение не равно произведению соответствующих частных, значит, мы сразу же можем говорить, что случайные величины зависимы. Таким образом, мы поняли, что случайные величины могут быть зависимыми или независимыми, и независимые случайные величины встречаются достаточно редко.

На следующей лекции мы рассмотрим и другие виды зависимостей случайных величин. На этом все.

Последнее изменение: Четверг, 10 декабря 2020, 09:42