logo
导航

相似与对角化

相似矩阵

相似矩阵的定义

定义:设 AABBnn 阶方阵,如果存在可逆矩阵 PP,使得: B=P1APB = P^{-1}AP

则称矩阵 AABB 相似,记为 ABA \sim B

相似矩阵的性质

性质 1:相似关系是等价关系(自反、对称、传递)。

性质 2:相似矩阵有相同的特征多项式。

性质 3:相似矩阵有相同的特征值。

性质 4:相似矩阵有相同的迹和行列式。

性质 5:相似矩阵有相同的秩。

相似矩阵的证明

证明性质 2: 设 B=P1APB = P^{-1}AP,则: BλI=P1APλI=P1APP1λIP=P1(AλI)P=P1AλIP=AλI|B - \lambda I| = |P^{-1}AP - \lambda I| = |P^{-1}AP - P^{-1}\lambda IP| = |P^{-1}(A - \lambda I)P| = |P^{-1}||A - \lambda I||P| = |A - \lambda I|

对角化

对角化的定义

定义:如果矩阵 AA 与对角矩阵相似,即存在可逆矩阵 PP 和对角矩阵 DD,使得: A=PDP1A = PDP^{-1}

则称矩阵 AA 可对角化

对角化的条件

定理nn 阶矩阵 AA 可对角化的充要条件是 AAnn 个线性无关的特征向量。

证明

  • 充分性:设 AAnn 个线性无关的特征向量 x1,x2,,xn\vec{x}_1, \vec{x}_2, \dots, \vec{x}_n,对应的特征值为 λ1,λ2,,λn\lambda_1, \lambda_2, \dots, \lambda_n。令 P=[x1,x2,,xn]P = [\vec{x}_1, \vec{x}_2, \dots, \vec{x}_n]D=diag(λ1,λ2,,λn)D = \operatorname{diag}(\lambda_1, \lambda_2, \dots, \lambda_n),则 A=PDP1A = PDP^{-1}
  • 必要性:如果 A=PDP1A = PDP^{-1},则 AP=PDAP = PD,即 AA 的列向量是 PP 的列向量的线性组合,且系数为 DD 的对角元素。

对角化的步骤

步骤

  1. 求特征值:解特征方程 AλI=0|A - \lambda I| = 0
  2. 求特征向量:对每个特征值,求对应的线性无关特征向量
  3. 构造矩阵PP 由特征向量组成,DD 由特征值组成
  4. 验证:验证 A=PDP1A = PDP^{-1} 是否成立

例子

例 1:判断矩阵 A=(2112)A = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix} 是否可对角化,如果可以,求对角化形式。

  1. 特征方程:AλI=λ24λ+3=0|A - \lambda I| = \lambda^2 - 4\lambda + 3 = 0
  2. 特征值:λ1=1\lambda_1 = 1λ2=3\lambda_2 = 3
  3. 特征向量:
    • λ1=1\lambda_1 = 1x1=(1,1)\vec{x}_1 = (1, -1)
    • λ2=3\lambda_2 = 3x2=(1,1)\vec{x}_2 = (1, 1)
  4. 构造矩阵:
    • P=(1111)P = \begin{pmatrix} 1 & 1 \\ -1 & 1 \end{pmatrix}
    • D=(1003)D = \begin{pmatrix} 1 & 0 \\ 0 & 3 \end{pmatrix}
  5. 对角化形式:A=PDP1A = PDP^{-1}

不可对角化的情况

不可对角化的条件

定理:如果矩阵 AA 有重特征值,且重特征值的几何重数小于代数重数,则 AA 不可对角化。

例子

例 2:判断矩阵 A=(1101)A = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} 是否可对角化。

  1. 特征方程:AλI=(1λ)2=0|A - \lambda I| = (1-\lambda)^2 = 0
  2. 特征值:λ=1\lambda = 1(二重根)
  3. 几何重数:解 (AI)x=0(A - I)\vec{x} = \vec{0},得到 x=(1,0)\vec{x} = (1, 0),几何重数为 1
  4. 代数重数为 2,几何重数为 1,所以不可对角化

对角化的应用

矩阵幂的计算

定理:如果 A=PDP1A = PDP^{-1},则 An=PDnP1A^n = PD^nP^{-1}

证明An=(PDP1)n=PDP1PDP1PDP1=PDnP1A^n = (PDP^{-1})^n = PDP^{-1} \cdot PDP^{-1} \cdot \dots \cdot PDP^{-1} = PD^nP^{-1}

矩阵函数的计算

定理:如果 A=PDP1A = PDP^{-1},则 f(A)=Pf(D)P1f(A) = Pf(D)P^{-1},其中 f(D)=diag(f(λ1),f(λ2),,f(λn))f(D) = \operatorname{diag}(f(\lambda_1), f(\lambda_2), \dots, f(\lambda_n))

若尔当标准形

若尔当标准形的定义

定义:对于不可对角化的矩阵,可以化为若尔当标准形: A=PJP1A = PJP^{-1}

其中 JJ 是若尔当矩阵,由若尔当块组成。

若尔当块

定义:形如 Ji=(λi1000λi10000λi)J_i = \begin{pmatrix} \lambda_i & 1 & 0 & \dots & 0 \\ 0 & \lambda_i & 1 & \dots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \dots & \lambda_i \end{pmatrix}

的矩阵称为若尔当块

练习题

练习 1

判断矩阵 A=(1101)A = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} 是否可对角化。

参考答案

解题思路: 检查是否有足够的线性无关特征向量。

详细步骤

  1. 特征方程:AλI=(1λ)2=0|A - \lambda I| = (1-\lambda)^2 = 0
  2. 特征值:λ=1\lambda = 1(二重根)
  3. 求特征向量:解 (AI)x=0(A - I)\vec{x} = \vec{0}
  4. (0100)(xy)=(00)\begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix}\begin{pmatrix} x \\ y \end{pmatrix} = \begin{pmatrix} 0 \\ 0 \end{pmatrix}
  5. 得到特征向量 x=(1,0)\vec{x} = (1, 0)
  6. 只有一个线性无关特征向量,少于矩阵阶数 2

答案:不可对角化

练习 2

求矩阵 A=(3102)A = \begin{pmatrix} 3 & 1 \\ 0 & 2 \end{pmatrix} 的对角化形式。

参考答案

解题思路: 按照对角化的步骤求解。

详细步骤

  1. 特征方程:AλI=(3λ)(2λ)=0|A - \lambda I| = (3-\lambda)(2-\lambda) = 0
  2. 特征值:λ1=2\lambda_1 = 2λ2=3\lambda_2 = 3
  3. 特征向量:
    • λ1=2\lambda_1 = 2x1=(1,1)\vec{x}_1 = (1, -1)
    • λ2=3\lambda_2 = 3x2=(1,0)\vec{x}_2 = (1, 0)
  4. 构造矩阵:
    • P=(1110)P = \begin{pmatrix} 1 & 1 \\ -1 & 0 \end{pmatrix}
    • D=(2003)D = \begin{pmatrix} 2 & 0 \\ 0 & 3 \end{pmatrix}
  5. 对角化形式:A=PDP1A = PDP^{-1}

答案A=PDP1A = PDP^{-1},其中 P=(1110)P = \begin{pmatrix} 1 & 1 \\ -1 & 0 \end{pmatrix}D=(2003)D = \begin{pmatrix} 2 & 0 \\ 0 & 3 \end{pmatrix}

练习 3

证明:相似矩阵有相同的特征值。

参考答案

解题思路: 利用相似矩阵有相同特征多项式的性质。

详细步骤

  1. ABA \sim B,即 B=P1APB = P^{-1}AP
  2. 相似矩阵有相同的特征多项式:AλI=BλI|A - \lambda I| = |B - \lambda I|
  3. 特征值是特征多项式的根
  4. 所以 AABB 有相同的特征值

答案:证明完成

练习 4

A=PDP1A = PDP^{-1},求 AnA^n

参考答案

解题思路: 利用对角化矩阵幂的性质。

详细步骤

  1. A=PDP1A = PDP^{-1}
  2. An=(PDP1)n=PDnP1A^n = (PDP^{-1})^n = PD^nP^{-1}
  3. Dn=diag(λ1n,λ2n,,λnn)D^n = \operatorname{diag}(\lambda_1^n, \lambda_2^n, \dots, \lambda_n^n)

答案An=PDnP1A^n = PD^nP^{-1},其中 Dn=diag(λ1n,λ2n,,λnn)D^n = \operatorname{diag}(\lambda_1^n, \lambda_2^n, \dots, \lambda_n^n)

练习 5

判断矩阵 A=(2112)A = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix} 是否可对角化,如果可以,求对角化形式。

参考答案

解题思路: 按照对角化的步骤求解。

详细步骤

  1. 特征方程:AλI=λ24λ+3=0|A - \lambda I| = \lambda^2 - 4\lambda + 3 = 0
  2. 特征值:λ1=1\lambda_1 = 1λ2=3\lambda_2 = 3
  3. 特征向量:
    • λ1=1\lambda_1 = 1x1=(1,1)\vec{x}_1 = (1, -1)
    • λ2=3\lambda_2 = 3x2=(1,1)\vec{x}_2 = (1, 1)
  4. 有两个线性无关特征向量,等于矩阵阶数
  5. 构造矩阵:
    • P=(1111)P = \begin{pmatrix} 1 & 1 \\ -1 & 1 \end{pmatrix}
    • D=(1003)D = \begin{pmatrix} 1 & 0 \\ 0 & 3 \end{pmatrix}
  6. 对角化形式:A=PDP1A = PDP^{-1}

答案:可对角化,A=PDP1A = PDP^{-1},其中 P=(1111)P = \begin{pmatrix} 1 & 1 \\ -1 & 1 \end{pmatrix}D=(1003)D = \begin{pmatrix} 1 & 0 \\ 0 & 3 \end{pmatrix}