Skip to main content

数学期望与方差

数学期望是随机变量的"平均值"(以概率为权重),方差衡量随机变量的波动程度。

数学期望

定义

离散型E(X)=kxkpkE(X) = \sum_k x_k \cdot p_k(要求绝对收敛)

连续型E(X)=xf(x)dxE(X) = \int_{-\infty}^{\infty} x f(x)\,dx(要求绝对可积)

期望的线性性质

E(aX+bY)=aE(X)+bE(Y)E(aX + bY) = aE(X) + bE(Y)

无需 XXYY 独立!这是期望最重要的性质。

随机变量函数的期望

Y=g(X)Y = g(X),则:

  • 离散型:E(Y)=kg(xk)pkE(Y) = \sum_k g(x_k) p_k
  • 连续型:E(Y)=g(x)f(x)dxE(Y) = \int_{-\infty}^{\infty} g(x) f(x)\,dx

无需先求 YY 的分布,直接用 XX 的分布计算。

方差与标准差

定义

Var(X)=E[(XE(X))2]\operatorname{Var}(X) = E[(X - E(X))^2]

标准差:σX=Var(X)\sigma_X = \sqrt{\operatorname{Var}(X)}

计算公式

Var(X)=E(X2)[E(X)]2\operatorname{Var}(X) = E(X^2) - [E(X)]^2

方差的性质

性质公式
常数方差为零Var(c)=0\operatorname{Var}(c) = 0
线性变换Var(aX+b)=a2Var(X)\operatorname{Var}(aX + b) = a^2 \operatorname{Var}(X)
独立和X ⁣ ⁣ ⁣YX \perp\!\!\!\perp Y,则 Var(X+Y)=Var(X)+Var(Y)\operatorname{Var}(X+Y) = \operatorname{Var}(X) + \operatorname{Var}(Y)
一般和Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)\operatorname{Var}(X+Y) = \operatorname{Var}(X) + \operatorname{Var}(Y) + 2\operatorname{Cov}(X, Y)

kk 阶矩

概念定义
kk 阶原点矩μk=E(Xk)\mu_k = E(X^k)
kk 阶中心矩νk=E[(XE(X))k]\nu_k = E[(X - E(X))^k]
  • 一阶原点矩 = 期望
  • 二阶中心矩 = 方差
  • 三阶中心矩 \to 偏度(衡量对称性)
  • 四阶中心矩 \to 峰度(衡量尾部厚度)

切比雪夫不等式

对任意 ε>0\varepsilon > 0

P(XE(X)ε)Var(X)ε2P(|X - E(X)| \geq \varepsilon) \leq \frac{\operatorname{Var}(X)}{\varepsilon^2}

或等价地:

P(XE(X)<ε)1Var(X)ε2P(|X - E(X)| < \varepsilon) \geq 1 - \frac{\operatorname{Var}(X)}{\varepsilon^2}

意义:方差越小,XX 越集中在期望附近。这是大数定律证明的核心工具。

其他特征数

特征数定义用途
变异系数CV=σ/μCV = \sigma / \mu比较不同量纲的离散程度
分位数xαx_{\alpha} 满足 P(Xxα)αP(X \leq x_{\alpha}) \geq \alpha刻画分布的尾部分位
中位数mm 满足 F(m)0.5F(m) \geq 0.5F(m)0.5F(m-) \leq 0.5分布的"中心"(抗异常值)
偏度γ1=E[(Xμ)3]/σ3\gamma_1 = E[(X-\mu)^3] / \sigma^3γ1>0\gamma_1 > 0 右偏,γ1<0\gamma_1 < 0 左偏
峰度γ2=E[(Xμ)4]/σ43\gamma_2 = E[(X-\mu)^4] / \sigma^4 - 3γ2>0\gamma_2 > 0 厚尾(比正态),γ2<0\gamma_2 < 0 薄尾

期望与方差速查表

分布期望方差
B(1,p)B(1, p)ppp(1p)p(1-p)
B(n,p)B(n, p)npnpnp(1p)np(1-p)
P(λ)P(\lambda)λ\lambdaλ\lambda
Geom(p)\text{Geom}(p)1/p1/p(1p)/p2(1-p)/p^2
U(a,b)U(a, b)(a+b)/2(a+b)/2(ba)2/12(b-a)^2/12
N(μ,σ2)N(\mu, \sigma^2)μ\muσ2\sigma^2
Exp(λ)\operatorname{Exp}(\lambda)1/λ1/\lambda1/λ21/\lambda^2
Γ(α,λ)\Gamma(\alpha, \lambda)α/λ\alpha/\lambdaα/λ2\alpha/\lambda^2