协方差衡量两个随机变量协同变化的方向和程度;相关系数是标准化后的协方差,取值在 [−1,1] 之间,刻画线性相关性。
协方差
Cov(X,Y)=E[(X−EX)(Y−EY)]
计算公式
Cov(X,Y)=E(XY)−E(X)E(Y)
| 性质 | 公式 |
|---|
| 对称性 | Cov(X,Y)=Cov(Y,X) |
| 自身 | Cov(X,X)=Var(X) |
| 线性 | Cov(aX+b,cY+d)=ac⋅Cov(X,Y) |
| 分配律 | Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z) |
| 独立性 | X⊥⊥Y⇒Cov(X,Y)=0(反之不真!) |
注意:Cov(X,Y)=0 仅意味着不(线性)相关,但 X 与 Y 可能仍有非线性依赖关系。
方差的和
Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)
推广到 n 个变量:
Var(∑i=1nXi)=∑i=1nVar(Xi)+2∑i<jCov(Xi,Xj)
当各变量两两不相关时,方差具有可加性。
相关系数
ρXY=Var(X)⋅Var(Y)Cov(X,Y)
基本性质
| 性质 | 说明 |
|---|
| $ | \rho |
| ρ=0 | X 与 Y 不相关 |
| ρ=±1 | Y=aX+b(几乎处处),即完全线性相关 |
| ρ>0 | 正相关(X 大时 Y 也倾向于大) |
| ρ<0 | 负相关(X 大时 Y 倾向于小) |
独立 ⇒ 不相关,反之不真
反例:X∼N(0,1),Y=X2。则 Cov(X,Y)=E(X3)−E(X)E(X2)=0,故 ρ=0。但显然 X 与 Y 完全不独立——Y 完全由 X 决定。
协方差矩阵
对随机向量 X=(X1,…,Xn)⊤,协方差矩阵 Σ 的元素为:
Σij=Cov(Xi,Xj)
性质:
- Σ 是对称矩阵
- Σ 是半正定矩阵
- 对角线元素 Σii=Var(Xi)
- 独立 ⇒ Σ 为对角阵
- 多元正态分布完全由均值向量 μ 和协方差矩阵 Σ 确定
重要结论
- 协方差为 0 ⇏ 独立(除非在多元正态中)
- 相关系数只衡量线性相关程度
- 若 Y=g(X) 是确定性函数,协方差可能为零(如 g 为偶函数、X 对称分布)