Видеолекция 2. Операции над матрицами

查看

 

На этой лекции мы введем основные операции над матрицами, рассмотрим свойства этих операций и приведем примеры выполнения операций над матрицами. С матрицами мы с вами работали, когда решали системы линейных уравнений.

Давайте вспомним, что под матрицей мы понимаем таблицу, разбитую на строки и столбцы. Если в матрице m  строк и n столбцов, то говорят, что имеется матрица m на n. В общем случае мы записываем матрицу в указанном виде как на слайде, и произвольный элемент обозначаем буквой с двумя индексами, где первый индекс это номер строки, второй индекс номер столбца. В сокращенном виде будем обозначать матрицу вот таким образом, записав элемент (aij).  Если необходимо подчеркнуть размерность матрицы, то в качестве нижнего индекса будем указывать размерность данной матрицы.

Часто будем использовать понятие равенства. Две матрицы A и B, мы считаем равными, если, во-первых, у них одинаковые размеры, а, во-вторых, равны соответствующие элементы, то есть для каждого индекса i и j, aij = bij. Зафиксируем произвольную размерность m и n, и множество всех матриц данного размера, обозначим M. Отметим, что, в частности, m и n могут равняться 1, получаем тривиальный случай, когда есть только одна строка и один столбец и матрица вырождается в одно число. Если число строк и столбцов одинаковое и равно число n, то матрицу называют квадратной n-го порядка. Если матрица квадратная, в этом случае для характеристики и размерности просто указываем одно число n. И множество всех квадратных матриц n-го порядка обозначим Mn.

Приступим к изучению операций. Начнем с операции сложения. Для того что бы сложить две матрицы, необходимо взять две матрицы одного размера и сложить их соответствующие элементы, таким образом суммой 2х матриц называется матрицу A+B , каждый элемент который равен сумме элементов исходной матрицы. Например, возьмем матрицы размером 2 на 3 и, складывая соответствующие элементы, после вычисления получится, указанная на слайде, матрица. И вот как видим, операция сложения матриц полностью определяется сложением соответствующих элементов, то есть сложением чисел.

Отметим свойства данной операции. Какие бы три матрицы A, B и C фиксированного размера мы не взяли, для них выполняется следующие свойства. Во-первых, операция сложения коммутативно. Такой термин означает, что слагаемые можно менять местами. Второе свойство, ассоциативность по сложению  означает, что  в сумме содержащей три слагаемых, можно ставить скобочки произвольным образом.

Введем понятие нулевой матрицы. Это матрица, у которой все элементы равны нулю. Очевидно, что если мы к матрице A прибавим нулевую матрицу, мы получим исходную матрицу A.

Далее для матрицы A можно определить противоположную к ней -A, для этого необходимо для каждого элемента рассмотреть противоположный. Если сложить две противоположные матрицы друг с другом, очевидно, получится нулевая матрица. Понятие противоположной матрицы позволяет ввести операцию вычитания. И так под вычитанием можно понимать матрицу вот такого вида, чтобы из A вычисть B, надо к A прибавить противоположную к B. Другими словами нужно вычисть у данных матриц соответствующие элементы.

Следующая операция умножения числа на матрицу. Итак, пусть нам дана матрица размером m на n и произвольное число r , для того чтобы умножить матрицу на это число, нужно каждый элемент матрицы умножить на данное число. Например, возьмем две матрицы второго порядка, первую умножим на 3 и из полученной матрицы вычтем вторую (см. на видео). Какими свойствами обладает указанная операция умножения числа на матрицу? Во-первых, если умножить матрицу на число 1, матрица не изменится. Во-вторых, если взять два числа и умножить на матрицу, то опять же скобочки можно поставить в произвольном порядке, результат не изменится. Так же имеет место свойства 3 и 4(см. на видео).

Обратите внимание, что данные свойства и четыре предыдущих в итоге нам дают 8 свойств, и это в точности, те свойства, которые определяют понятие векторного пространства.

Таким образом, на множестве всех матриц фиксированного размера, мы имеем две операции. Операцию сложения и умножения матрицы на число. Эти операции удовлетворяют свойствам, а это значит, имеет место такая теорема. Множество всех матриц фиксированного размера, относительно введенных операции, образует векторное пространство.

Отметим, что свойства 3 и 4 называются дистрибутивными законами. То есть, когда мы вносим матрицу A в скобку, в которой записана сумма чисел, то имеем дистрибутивность относительно чисел, но когда мы число умножаем на сумму матриц, то есть, вносим число в скобку, то получаем другой аналог дистрибутивного закона.

Интересная операция транспонирования, не сложная операция. Если мы имеем произвольную матрицу A, и что бы получит транспонированную к ней матрицу, необходимо каждую ее строку сделать столбцом. Если у нас в матрице A было m строк и n столбцов, то в транспонированной матрице будет n строк и m столбцов. Например (см. на видео), возьмем матрицу размером 3 на 2 и транспонируем ее, получим следующую матрицу. Элементы, как таковые не изменились, единственное, что первый столбец 1,3,5  перешел в первую строку или другими словами первая строка 1,2 перешла в первый столбец. Аналогично для остальных строк и столбцов. Говоря простым языком, у транспонированной матрицы строки и столбцы поменяны местами.

Свойства операции транспонирования. Берем две произвольные матрицы, некоторого подходящего размера и если мы выполним данную операцию два раза подряд, то получим исходную матрицу. Свойство очевидно, то есть с начала строки перейдут в столбцы, а затем обратно столбцы перейдут в строки.

Далее, матрица, транспонированная к сумме, равна сумме транспонированных матриц.

Имеет место третье свойство, числовой коэффициент можно вынести за скобку. От этого результат никак не изменится.

Интересно 4 свойство, не такое очевидное, смысл его в следующем. Напомню, что рангом матрицы мы назвали ранг ее системы векторов строк, то есть число векторов в базисе. Получается, если мы возьмем произвольную матрицу и рассмотрим векторы строки, а затем для этой же матрицы рассмотрим систему, состоящую из векторов столбцов, то ранги этих систем будут одинаковые.

Теперь перейдем к операции умножения матриц, до этого мы говорили про умножение числа на матрицу, а теперь рассмотрим умножение двух матриц. Эта операция устроена уже более сложным образом, нежели предыдущие операции, но тем, ни менее сводится к операции сложения и умножения чисел. Итак, для того чтобы умножить матрицу A на B, надо потребовать, чтобы число столбцов в первой матрице было равно числу строк во второй матрице. То есть обратите внимание матрицы A и B вот такого размера (см. на видео). Числа m, n и p произвольные, но n это число столбцов в первой матрице, а так, же самое число строк во второй матрице. После умножения мы получим новую матрицу, её размер будет m на p, то есть в новой матрице будет столько же строк сколько и в первой матрице, а столбцов столько же сколько в матрице B.  Каждый элемент определяется по указанному правилу, оно записывается формулой (см. на видео), и, на первый взгляд, формула сложная, и не понятно, что за ней кроется. Постараемся разобраться  с этим правилом на примерах и с помощью определенных схем. Главное запомнить, что мы берем для нахождения элемента стоящего в i-ой строке и j-ом столбце, i-ую строку в первой матрице и j-ый столбец во второй матрице.

Итак обратимся к схеме. Пусть матрица A имеет вид (см.на видео ), элементы aij, элементы матрицы B bij имеют вот такой вид (см.на видео ), и нам надо найти все элементы в новой матрице, то есть элементы cij. Как было сказано надо взять i-ую строку в матрице A  и j-ый столбец в матрице B (см.на видео). Коротко говорят, что i строка умножается на j столбец, это означает, что каждый элемент i-той строки умножается на соответствующий элемент j-го столбца и получается сумма. На схеме она записана подробно, то есть элемент аi1 умножается на элемент b1j, дальше берем вторые элементы и так далее, затем полученные произведения суммируем, тем самым получаем нужный элемент cij и, перебирая, таким образом, все значения i и j, в результате получаем матрицу.

Ита,к отработаем данную операцию на примере (см. на видео). Еще раз отметим схему и постараемся посмотреть, как это будет в реальности. Итак, возьмем две матрицы первая матрица размером 2 на 3, вторая размером три на два. Условие выполняется, матрица имеет нужные размеры. И так результирующая матрица будет размером 2 на 2, потому что в первой матрице две строки, во второй два столбца, значит, нам нужно найти 4 элемента. Постараемся их подробно расписать, начнем с первого элемента c11, то есть берем первую строку первой матрицы и первый столбец во второй матрице и умножаем поэлементно, то есть соответствующий элемент 1 на 2, 3 на -1, 1 на 3 и складываем. Так записали подробно данную сумму. Сейчас подобную сумму составим для всех элементов, а затем вычислим.

А теперь давайте найдем элемент c12, то есть элемент, находящийся в первой строке 2 столбца. Значит, берем первую строку первой матрицы, и второй столбец второй матрицы также умножаю. Получаем записанное выражение, по тому же самому принципу. Теперь перейдём ко второй строке. Нам надо взять уже вторую строку первой матрицы. Вначале умножаем на первый столбец второй матрицы, получаем соответствующий элемент c21. Вот такой, но затем первую строку умножаем на второй столбец. Получаем элемент c22 в нужной матрице. И так осталось произвести вычисления и получить результат. Вот так выполняется указанная процедура умножение двух матриц. Теперь рассмотрим свойства введенной операции. Берем матрицы A, B и C необходимого размера. Вначале отметим равенство, которое не выполняются.

В отличие от операции сложения операция умножения уже не коммутативна. То есть поменяв местами матрицы A и B, мы можем не получить матрицу, потому что могут не совпасть размерности матрицы A и B. Но даже если мы и получим какую-то матрицу, она не обязана совпасть  первоначальной, то есть в общем случае, как уже было сказано, операция умножения не обладает коммутативным свойством. А вот ассоциативный закон справедлив, если мы имеем три множителя матрицы A, B и C, то скобочки можно поставить в любом порядке, но при этом, не изменяя порядок записи матриц.

 Далее для матриц справедлив дистрибутивный закон, то есть матрицу A можно умножить на сумму, раскрыв скобки, причем мы можем умножить на сумму справа, можем умножить на сумму слева. Так как операция не обладает коммутативным свойством, мы говорим о двух законах и в будущем мы часто будем говорить такие слова. Умножим матрицы в определенном порядке, то есть умножим какую-то матрицу на другую матрицу слева, либо справа. Это важно в силу вышесказанного.

Коротко говоря, свойство 3 означает, что операция умножения дистрибутивна относительно операции сложения матриц.

Далее имеет место 4 свойство, связь операции умножения матриц, операцию умножения на число. Введём важное понятие единичной матрицы. Эта матрица, которая получается из единичных векторов, при этом такую матрицу можно составить для любого n, то есть для каждого числа получается единичная матрица n-ого порядка, при этом имеет место такое равенство. Если умножим матрицу A, на единичную, мы получим матрицу A, и даже если умножим в другом порядке, все равно ничего не изменится, то есть, получая опять же аналог с умножением числа на единицу.

И вот теперь, если нам говорить об аналогии между матрицами и числами, то можно отметить следующие. Во-первых, как и для чисел, мы научились матрицы складывать, причем все свойства, для сложения матриц аналогичны свойствам для сложения чисел. В силу того, как операция сложения определяется. Далее ввели операцию умножения матриц, но эта операция похожа на операцию умножения в плане свойств. За исключением первого замечания, того что операция умножения матриц не коммутативна. В остальном все свойства точно такие же. В частности, ассоциативность, дистрибутивность и аналог единиц, где единичная матрица это как будто бы числовая единица. Далее для чисел кроме сложения вычитания, умножения у нас еще есть операции деления.

 Когда мы делим число a на число b, мы другими словами умножаем a на число обратное к b, в соответствии с этим возникает вопрос. Что такое обратная матрица и вообще можно ли матрицы делить? Оказывается, что можно ввести понятие обратной матрицы, но обратная существует уже не для любой матрицы. Определение такое.

Возьмем квадратную матрицу A, тогда обратной к ней называется такая матрица, которая при умножении на исходную, дает единичную, причем в любом порядке.

Для обозначения обратной матрицы используют ту же самую букву с указанием верхнего индекса -1. Читается как A в минус первой степени. Теперь предлагаю рассмотреть примеры. Еще один пример на умножение, а затем пример с обратной матрицей. Этот пример иллюстрирует одно из упомянутых свойств.

Давайте возьмем некоторую матрицу и умножим ее на единичную. Убедимся, что в этом случае матрица не изменится. То есть проиллюстрируем указанное свойство на конкретном примере. И так выполнив преобразование, обратите внимание, что мы делаем, вначале первую строку умножаем на первый столбец. В силу того что много нулей, мы отметили ненулевое произведение. Один на один, ну и плюс 0, потому что все оставшиеся произведений обнулятся и так для каждого элемента. После указанных преобразований, нетрудно увидеть, что ничего не меняется.

Теперь давайте умножим две матрицы второго порядка, получим следующую матрицу (см. на видео). Опять же выполняем четыре преобразования, потому что у нас каждая строка в первой должна быть умножена на каждый столбец во второй матрице. Получается вот такая матрица (см. на видео), причем заметим, что она будет единичной. Если же мы выполним умножение в обратном порядке, то получим точно такую же матрицу. Предлагаю вам убедиться в этом самостоятельно, то есть, несмотря на то, что я сказал, что операция умножения не коммутативная это не означает, что равенство всегда не выполняются. В некоторых случаях она выполниться может.

Мы получили, что две указанные матрицы является взаимно обратными, то есть каждая из них является обратной к другой в силу определения, потому что их произведение дает единичную матрицу.

Давайте умножим нулевую матрицу второго порядка на произвольную. Очевидно, из определения умножения получится нулевая матрица. Все обнулится и отсюда хорошо видно, что для нулевой матрицы обратной не существует, потому, что в результате получается снова нулевая матрица.  Также можно обратить внимание, что даже если бы мы умножили матрицу не нулевую, а вот такую (см. на видео), то есть давайте оставим в первой строке нолики, а во второй запишем произвольные числа. После умножения все равно первая строка обнулится, потому что первую строку умножаем на любой столбец, понятно, что будет 0.  В этом случае, как я уже сказал, в первой строке будут стоять одни 0 и значит, единичная матрица никак получится, не сможет, а значит и обратная к ней тоже существовать не будет, то есть обратная матрица определено существует не для всех квадратных матриц.

Теперь поговорим о связи операции умножения с системами линейных уравнений. Запишем произвольную систему, как мы это делали с вами раньше, и рассмотрим для этой системы некоторые матрицы. Мы уже работали с основной матрицей, составленной из коэффициентов данных уравнений, при этом берем именно коэффициенты из левой части. Отдельно запишем матрицу, составленную из свободных членов, запишем в столбец, а также в качестве через  X обозначим столбец неизвестных.

Итак, имеем три матрицы при этом X и B это матрицы, в которых ровно один столбец. Давайте умножим A на X, другими словами мы каждую строку матрицы A умножим на единственный столбец матрицы X. В силу нашего определения получится вот такая матрица (см. на видео). Еще раз отметим. Рассмотрим первую строку, умножаем на столбец, то есть, умножаем соответствующие элементы строки и столбца, затем складываем. Получается вот такой элемент, как видите это, то же самое что левая часть первого уравнения. Аналогично умножаем вторую строку на столбец, получается левая часть второго уровня и так и так далее.

Таким образом, заменяя левые на правые части уравнений, получается матрица B. Другими словами исходную систему линейных уравнений мы записали, как говорят в маточной форме виде A*X = B.  И так вот такая краткая запись A*X = B называется маточным видом системы линейных уравнений. Что мы отсюда можем получить?

Имеет место следующая теорема. Система уравнений имеет единственное решение тогда и только тогда, когда ее основная матрица A имеет обратную. Давайте подумаем, что это означает и как это решение может быть найдено. И так запишем систему в маточной форме A*X = B и домножим данное равенство слева на обратную матрицу. Предположив, что обратная существует. Получается следующее равенство (см. на видео). Здесь важно, что мы умножаем слева, то есть в каждой из частей уравнения множитель A-1 записан именно слева. Далее по свойствам перебросим скобочки в левой части уравнения и произведение A-1*A заменим на единичную матрицу. По свойству единичной матрицы получаются, что слева стоит матрица X, то есть неизвестный столбец без переменных, который может быть выражен через матрицы A и B, точнее через матрицу обратную к A.  Итак, получается, что если у нас матрица A имеет обратную, то выполнив операцию умножения A-1* B, мы получим неизвестную матрицу X.

Так, таким образом, если матрица имеет обратную, то исходную систему можно решить, выполнив указанные операции, то есть обратную к A умножить на B.

Возникает вопрос. Каким же образом можно найти обратную матрицу? Есть разные алгоритмы. Давайте познакомимся сейчас со следующей теоремой, которая дает правило нахождения обратной матрицы, при условии, что она существует.

Допустим, что мы имеем квадратную матрицу A, если мы справа к этой матрице припишем единичную того же самого порядка и будем выполнять элементарное преобразование над строками, так чтобы матрица A приобретет единичную,  тогда справа получим в точности обратную к матрице.

Предлагаю проиллюстрировать данный алгоритм на простом примере.  Возьмем матрицу второго порядка и выполним, указанные преобразования. Формально дописали единичную, чтобы матрицы не сливались их условно можно разделить некоторой чертой, но дальше забыв про эту черту, начинаем выполнять преобразование над строками, таким образом, чтобы получилась единичная матрица. Вначале мы будем стараться привести к ступенчатой матрице. Это мы уже умеем делать, то есть будем получать нолики под ведущими элементами каждой строки. Итак, получили вот такой нолик, у нас, по сути  имеется ступенчатая матрица, но для нахождение единичной надо чтобы ведущие элементы 2 и 5 превратились в единичные элементы. Для этого вначале поделим вторую строку на 5, получив ведущий элемент единицу, а далее сложим первую и вторую строки, для того чтобы получить нолик над единицей.  Сейчас вы уже видите, для того чтобы образовалась единичная матрица достаточно поделить первую строку на 2, причем напоминаю, мы выполняем операции над всеми строками, невзирая на поставленную черту.  После деления получается, что слева от черты записана единичная матрица, а то, что получилось справа и есть обратная к первоначальной матрице. Вот такой интересный алгоритм, который мы с вами еще раз отработаем на практическом занятии.

 

最后修改: 2021年02月4日 Четверг 08:48