资料来源参考连接: 如何理解矩阵特征值和特征向量 行列式的本质是什么 相似矩阵是什么
引子
问题(该问题来源于麻省理工公开课:线性代数 24课 马尔科夫矩阵和傅里叶级数):假设有两个州分别为加利福尼亚和麻省,加州每过1个单位的时间会有10%的人从加州移居到麻省,有90%的人继续留在加州,麻省有%20的人移居到加州,仅有80%的人依然留在麻省。假设最开始麻省有1000人加州0人,问经过无限长的时间后两个州剩下的人数?
思路
这个问题实际上问的是矩阵幂运算过程中的稳态, $ 因此,无限时间后两州剩下的人数就可以看作是$
下面详细说明为什么,这个题目要这样做。
左乘矩阵的本质
要解开开头的问题,我们首先需要明白向量左乘矩阵的本质:
向量左乘矩阵,实际上可以看作是对向量施加一个运动,亦或是一个线性变换。因此,线性方程 $ 可以理解为将向量 x 进行线性变换 A 得到向量 b。
线性变换
线性变换在几何上就是包含对一条线段进行推移和旋转运动的一种变换,它有三个性质:
- 变换前是直线,变换后依然是直线
- 直线的比例保持不变
- 变换前是原点,变换后依然是原点
线性变换的本质是对该n维空间上的基向量的拉伸和旋转,设二维空间中有基向量$
线性变换前
线性变换(拉伸旋转)后:
假设我们有一个旋转矩阵$,那么通过左乘这个旋转矩阵,就可以实现一个向量在二维平面上的旋转。
同理,若是左乘一个对角方阵,则可视为向量通过该矩阵实现了拉伸。
特征向量和特征值
设有矩阵A,则在线性方程 $ 中,λ就是A的特征值,x就是A的特征向量。
意义
在理解矩阵实际上可视为一种运动之后,就比较好理解特征值和特征向量对于矩阵的意义,狭义上,我们可以认为,特征向量就是运动的方向,特征值就是运动的速度。
假设在空间中有一个向量v,那么 A·v 就可以视为v经过A变换之后形成的新向量,如果,这个经过变换之后的向量 v’ 的方向与v相同,那么就可以得到线性方程 Av=λv,所以在对v进行A变换实际上就是在让v以λ速度往v方向进行变换。
当然广义上特征向量与特征值肯定不只是指方向和速度,它还有更多的含义。
计算
要计算一个矩阵的特征值和特征向量,我们可以从他的方程入手: $
性质
特征值可能为实数也可能为复数,有时候也会不存在。
矩阵特征值的和为其对角线上元素的和(迹)
矩阵特征值的积为其行列式的值
马尔科夫矩阵
若一个系统的某些因素第n次的变换的结果仅受它的第n-1个结果影响,那么这些因素的变换就可以由马尔科夫矩阵来修饰。
性质
假设有一个马尔科夫矩阵: $
- 那么我们可以发现,它的每一列元素之和为1,即0.9+0.1=1,0.2+0.8=1,表示受变换向量中的元素的总值不变。
- 它的元素全部为非负数,因为马尔科夫矩阵与概率有关,而概率是非负的。
上面两个是马尔科夫矩阵的性质,由幂运算达到稳态需要矩阵特征值为1,我们可以得到推论:
- 马尔科夫矩阵有一个特征值为1
- 它的其它特征值的绝对值小于1
一个特征值为1很容易证明,只需要用 $ $
稳态
接下计算$ $ $ $ $
应用
那么看回开头的题目,由于题目中的马尔科夫方阵只有二维,那么它的另一个特征值 $ 然后求特征向量: $ $ $