
2.5 矩阵和变换
英国数学家凯利在19世纪首先提出了矩阵(Matrix)的概念,它是一个按照长方形阵列排列的复数或实数集合,最初是由方程组的系数及常数所构成的方阵。
可以用坐标系变换来描述矩阵作用的本质。例如,一个平面直角坐标系向左旋转了90°,怎样才能用数字描述这种运动呢?有一种办法:盯紧(1, 0)和(0, 1)这两个基向量对应的坐标点在新坐标系中的位置,并描述相对于原坐标系中的位置的变化。
变换和函数的作用类似,称之为“变换”是为了体现出图形上的变化。线性变换是其中一种变换,它有两个特征:
· 如果变换前是直线,那么线性变换以后仍然是直线。
· 如果将坐标系的原点固定,那么经过线性变换后,新坐标系的原点仍然保持原位,不会移动。
在二维空间中,如果知道两个不共线的向量,也知道它们经过线性变换后的结果向量,就可以求出该二维空间中的任意向量经过同样线性变换后的结果向量。因为通过这两个向量就可以知道变换后的空间的基向量是什么,而得到了基向量,就得到了整个坐标系。这个道理对多维空间同样适用。
在图2-9中,已知i和j是基向量和
通过已知矩阵变换后得到的向量。如果
为变换前的向量,那么通过同样的矩阵做变换的过程如图2-9所示。

图2-9 i和j矩阵乘法变换过程,将x和y分别与向量做数乘
我们可以将上式中的实数用a b c d、、、来替代。下式展示了矩阵对向量作用的过程,其实也可以理解为向量对矩阵的各列进行线性组合,这个式子和图2-9中的式子代表的含义是一样的,只不过换了一种写法,将坐标写到一起,就构成了矩阵。在该例中,矩阵含有两个向量,x和y是这两个向量线性组合的系数。

还可以从另一个角度理解:通过矩阵对向量
进行线性变换,得到新的向量
。
上面的矩阵变换可以看成将(1, 0)变换成(a, c)、将(0, 1)变换成(b, d),然后通过变换后的矩阵,可以求得向量(x, y)经过同样的变换后,会得到什么向量。这也说明单位矩阵(各个元素都是1的矩阵)的乘法具有不变性,因为经过单位矩阵作用之后得到的还是原来的向量。
下式中的x和y就是在以和
为基向量的新坐标系中的横纵坐标。

矩阵乘法的本质(更详细的介绍见2.6节)就是线性变换,可以这样理解:矩阵乘法就是逐行对其中一个矩阵的基向量做线性变换。我们可以认为上式中的(a, c)和(b, d)两个坐标,和原坐标系中的(1, 0)、(0, 1)具有一样的作用,只不过以(a, c)、(b, d)为基向量的坐标系是由以(1, 0)、(0, 1)为基向量的坐标系通过拉伸旋转等操作变化而来的。
如果把任意两个基向量的坐标竖起来写到一起,就变成矩阵了。现在我们思考下式代表什么含义。

· 矩阵A对应的基向量是和
,而标准平面直角坐标系的基向量是
和
,因而矩阵A对应的坐标系相当于把标准平面直角坐标系逆时针旋转90°得到的。如果把这一过程看成动态变化的,则矩阵A就可以用来表示这一过程。
· 由于坐标轴旋转了,整个坐标系也会随之旋转,标准平面直角坐标系内的所有向量也会一同旋转。
· 当标准平面直角坐标系里的任意向量被矩阵A施加变换以后,就得到了新坐标系内对应的向量,在该例中,就是得到了逆时针旋转90°后的向量。
在标准平面直角坐标系中,向量和
构成了最基本的二维单位矩阵。其他所有的矩阵都可以看成是对单位矩阵的变换。每一个2×2矩阵可以看作一套坐标系。