Skip to main content

联合分布与边际分布

联合分布函数

二维随机变量 (X,Y)(X, Y)联合分布函数

F(x,y)=P(Xx,Yy),(x,y)R2F(x, y) = P(X \leq x, Y \leq y), \quad (x, y) \in \mathbb{R}^2

性质

  1. 单调性FF 对每个变元单调不减
  2. 有界性F(,y)=F(x,)=0F(-\infty, y) = F(x, -\infty) = 0F(+,+)=1F(+\infty, +\infty) = 1
  3. 右连续性FF 对每个变元右连续
  4. 矩形概率非负P(a<Xb,c<Yd)=F(b,d)F(a,d)F(b,c)+F(a,c)0P(a < X \leq b, c < Y \leq d) = F(b,d) - F(a,d) - F(b,c) + F(a,c) \geq 0

离散型:联合分布列

pij=P(X=xi,Y=yj),i,j=1,2,p_{ij} = P(X = x_i, Y = y_j), \quad i, j = 1, 2, \ldots

满足 pij0p_{ij} \geq 0,且 i,jpij=1\sum_{i,j} p_{ij} = 1

边际分布列

对另一变量求和(或积分)消去:

P(X=xi)=pi=jpij,P(Y=yj)=pj=ipijP(X = x_i) = p_{i\cdot} = \sum_{j} p_{ij}, \qquad P(Y = y_j) = p_{\cdot j} = \sum_{i} p_{ij}

连续型:联合密度

若存在非负函数 f(x,y)0f(x, y) \geq 0,使:

F(x,y)=xyf(u,v)dvduF(x, y) = \int_{-\infty}^{x} \int_{-\infty}^{y} f(u, v)\,dv\,du

则称 (X,Y)(X, Y) 为连续型,f(x,y)f(x, y) 为其联合概率密度

性质

  1. f(x,y)0f(x, y) \geq 0
  2. R2f(x,y)dxdy=1\iint_{\mathbb{R}^2} f(x, y)\,dx\,dy = 1
  3. ff 的连续点:2Fxy=f(x,y)\dfrac{\partial^2 F}{\partial x \partial y} = f(x, y)
  4. 区域概率:P((X,Y)D)=Df(x,y)dxdyP((X, Y) \in D) = \iint_D f(x, y)\,dx\,dy

边际密度

fX(x)=f(x,y)dy,fY(y)=f(x,y)dxf_X(x) = \int_{-\infty}^{\infty} f(x, y)\,dy, \qquad f_Y(y) = \int_{-\infty}^{\infty} f(x, y)\,dx

重要:边际分布由联合分布唯一确定,但反之不然——不同的联合分布可以有相同的边际。

独立性判定

定理XXYY 相互独立     \iff 联合分布函数等于边际分布函数的乘积: F(x,y)=FX(x)FY(y),x,yF(x, y) = F_X(x) \cdot F_Y(y), \quad \forall x, y

等价形式:

  • 离散型pij=pipjp_{ij} = p_{i\cdot} \cdot p_{\cdot j},对所有 i,ji, j
  • 连续型f(x,y)=fX(x)fY(y)f(x, y) = f_X(x) \cdot f_Y(y)(几乎处处成立)

独立性的结构

X ⁣ ⁣ ⁣YX \perp\!\!\!\perp Y,则联合分布完全由边际分布决定。对于连续型,"独立"等价于联合密度可分解为 xx 的函数与 yy 的函数的乘积。

多元正态分布

(X1,,Xn)(X_1, \ldots, X_n) 服从 nn 元正态分布的关键性质:

  1. 任意线性组合 aiXi\sum a_i X_i 均为一元正态
  2. 各分量相互独立     \iff 两两不相关(协方差为零)
  3. 边际分布仍为正态分布
  4. 条件分布仍为正态分布