协方差与相关系数
协方差的定义
协方差的数学定义
定义:设 X 和 Y 是两个随机变量,如果 E(X) 和 E(Y) 都存在,则称:
Cov(X,Y)=E[(X−E(X))(Y−E(Y))]
为 X 和 Y 的协方差。
协方差的计算公式
离散型随机变量:
Cov(X,Y)=∑i,j(xi−E(X))(yj−E(Y))P(X=xi,Y=yj)
连续型随机变量:
Cov(X,Y)=∫−∞+∞∫−∞+∞(x−E(X))(y−E(Y))f(x,y)dxdy
协方差的简化计算公式
公式:Cov(X,Y)=E(XY)−E(X)E(Y)
证明:
Cov(X,Y)=E[(X−E(X))(Y−E(Y))]=E(XY−XE(Y)−YE(X)+E(X)E(Y))
=E(XY)−E(X)E(Y)−E(Y)E(X)+E(X)E(Y)=E(XY)−E(X)E(Y)
协方差的直观理解
理解:协方差反映了两个随机变量之间的线性相关程度。正值表示正相关,负值表示负相关,零值表示不相关。
协方差的例子
例 1:设 X 和 Y 的联合分布律为:
X\Y | 0 | 1 |
---|
0 | 0.3 | 0.2 |
1 | 0.2 | 0.3 |
求 Cov(X,Y)。
解:
- E(X)=0×0.5+1×0.5=0.5
- E(Y)=0×0.5+1×0.5=0.5
- E(XY)=0×0×0.3+0×1×0.2+1×0×0.2+1×1×0.3=0.3
- Cov(X,Y)=E(XY)−E(X)E(Y)=0.3−0.5×0.5=0.05
协方差的性质
对称性
性质 1:Cov(X,Y)=Cov(Y,X)
证明:Cov(X,Y)=E[(X−E(X))(Y−E(Y))]=E[(Y−E(Y))(X−E(X))]=Cov(Y,X)
线性性
性质 2:Cov(aX+b,cY+d)=ac⋅Cov(X,Y),其中 a,b,c,d 是常数。
证明:
Cov(aX+b,cY+d)=E[(aX+b−E(aX+b))(cY+d−E(cY+d))]
=E[(aX−aE(X))(cY−cE(Y))]=ac⋅E[(X−E(X))(Y−E(Y))]=ac⋅Cov(X,Y)
可加性
性质 3:Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
证明:
Cov(X1+X2,Y)=E[(X1+X2−E(X1+X2))(Y−E(Y))]
=E[(X1−E(X1)+X2−E(X2))(Y−E(Y))]
=E[(X1−E(X1))(Y−E(Y))]+E[(X2−E(X2))(Y−E(Y))]=Cov(X1,Y)+Cov(X2,Y)
与方差的关系
性质 4:Cov(X,X)=D(X)
证明:Cov(X,X)=E[(X−E(X))2]=D(X)
独立随机变量的协方差
性质 5:如果 X 和 Y 独立,则 Cov(X,Y)=0
证明:如果 X 和 Y 独立,则 E(XY)=E(X)E(Y),所以 Cov(X,Y)=E(XY)−E(X)E(Y)=0
注意:逆命题不成立,即 Cov(X,Y)=0 不一定意味着 X 和 Y 独立。
相关系数的定义
相关系数的数学定义
定义:设 X 和 Y 是两个随机变量,D(X)>0,D(Y)>0,则称:
ρXY=D(X)D(Y)Cov(X,Y)=σXσYCov(X,Y)
为 X 和 Y 的相关系数,其中 σX=D(X),σY=D(Y)。
相关系数的性质
性质 1:−1≤ρXY≤1
证明:利用柯西-施瓦茨不等式:
∣E[(X−E(X))(Y−E(Y))]∣≤E[(X−E(X))2]E[(Y−E(Y))2]
所以 ∣Cov(X,Y)∣≤σXσY,即 ∣ρXY∣≤1。
性质 2:ρXY=1 当且仅当 Y=aX+b,其中 a>0
性质 3:ρXY=−1 当且仅当 Y=aX+b,其中 a<0
性质 4:ρXY=0 当且仅当 Cov(X,Y)=0
相关系数的直观理解
理解:
- ρXY=1:完全正相关
- ρXY=−1:完全负相关
- ρXY=0:不相关
- 0<ρXY<1:正相关
- −1<ρXY<0:负相关
相关系数的例子
例 2:继续例 1,求 ρXY。
解:
- D(X)=E(X2)−[E(X)]2=0.5−0.25=0.25
- D(Y)=E(Y2)−[E(Y)]2=0.5−0.25=0.25
- σX=σY=0.25=0.5
- ρXY=σXσYCov(X,Y)=0.5×0.50.05=0.2
协方差矩阵
二维随机变量的协方差矩阵
定义:设 (X,Y) 是二维随机变量,则其协方差矩阵为:
Σ=(D(X)Cov(Y,X)Cov(X,Y)D(Y))=(σX2σYXσXYσY2)
协方差矩阵的性质
性质 1:协方差矩阵是对称矩阵
性质 2:协方差矩阵是半正定矩阵
性质 3:如果 X 和 Y 独立,则协方差矩阵是对角矩阵
多维随机变量的协方差
多维随机变量的协方差矩阵
定义:设 X=(X1,X2,…,Xn)T 是 n 维随机变量,则其协方差矩阵为:
Σ=D(X1)Cov(X2,X1)⋮Cov(Xn,X1)Cov(X1,X2)D(X2)⋮Cov(Xn,X2)……⋱…Cov(X1,Xn)Cov(X2,Xn)⋮D(Xn)
多维随机变量的性质
性质 1:协方差矩阵是对称矩阵
性质 2:协方差矩阵是半正定矩阵
性质 3:如果 X1,X2,…,Xn 两两独立,则协方差矩阵是对角矩阵
协方差和相关系数的应用
在统计中的应用
应用 1:线性回归
相关系数是衡量线性关系强度的重要指标。
应用 2:主成分分析
协方差矩阵是主成分分析的基础。
应用 3:多元统计分析
协方差矩阵是多元统计分析的核心。
在金融中的应用
应用 4:投资组合理论
协方差矩阵用于计算投资组合的风险。
应用 5:风险管理
相关系数用于评估不同资产之间的风险分散效果。
练习题
练习 1
已知 E(X)=1,E(Y)=2,Cov(X,Y)=3,σX=2,σY=1,求 ρXY。
参考答案
解题思路:
使用相关系数的定义。
详细步骤:
- ρXY=σXσYCov(X,Y)
- =2×13=1.5
答案:1.5
练习 2
已知随机变量 X 和 Y 的联合分布律为:
X\Y | 0 | 1 |
---|
0 | 0.4 | 0.1 |
1 | 0.1 | 0.4 |
求 Cov(X,Y)。
参考答案
解题思路:
使用协方差的简化计算公式。
详细步骤:
- E(X)=0×0.5+1×0.5=0.5
- E(Y)=0×0.5+1×0.5=0.5
- E(XY)=0×0×0.4+0×1×0.1+1×0×0.1+1×1×0.4=0.4
- Cov(X,Y)=E(XY)−E(X)E(Y)=0.4−0.5×0.5=0.15
答案:0.15
练习 3
已知 X 和 Y 独立,D(X)=4,D(Y)=9,求 D(X+Y)。
参考答案
解题思路:
使用独立随机变量方差的可加性。
详细步骤:
- 如果 X 和 Y 独立,则 D(X+Y)=D(X)+D(Y)
- =4+9=13
答案:13
练习 4
已知随机变量 X 和 Y 的相关系数为 0.8,D(X)=4,D(Y)=9,求 Cov(X,Y)。
参考答案
解题思路:
使用相关系数的定义。
详细步骤:
- ρXY=D(X)D(Y)Cov(X,Y)
- 0.8=4×9Cov(X,Y)=6Cov(X,Y)
- Cov(X,Y)=0.8×6=4.8
答案:4.8
练习 5
证明:如果 X 和 Y 独立,则 ρXY=0。
参考答案
解题思路:
利用独立随机变量的协方差为零。
详细步骤:
- 如果 X 和 Y 独立,则 Cov(X,Y)=0
- 所以 ρXY=D(X)D(Y)Cov(X,Y)=D(X)D(Y)0=0
答案:证明完成