Skip to main content

向量到子空间的距离

向量到子空间的距离是内积空间中的核心几何问题,其答案是最小二乘法的理论基础。

问题的提法

在欧氏空间 VV 中,给定有限维子空间 WW 和一个向量 αV\alpha \in V。求 α\alphaWW最短距离

d=minwWαwd = \min_{w \in W} \|\alpha - w\|

正交投影

定理(投影定理)

定理α\alphaWW 的最短距离在且仅在 α\alphaWW 上的正交投影 β\beta 处达到,即 αβW\alpha - \beta \perp W

换句话说:!βW\exists! \beta \in W 使 α=β+γ\alpha = \beta + \gamma,其中 βW\beta \in WγW\gamma \perp Wβ\betaα\alphaWW 上的正交投影,γ\gammaα\alphaWW^\perp 上的分量。

证明思路

对任意 wWw \in Wαw2=(αβ)+(βw)2=αβ2+βw2\|\alpha - w\|^2 = \|(\alpha - \beta) + (\beta - w)\|^2 = \|\alpha - \beta\|^2 + \|\beta - w\|^2(因为 αβW\alpha - \beta \perp W,故 αββw\alpha - \beta \perp \beta - w)。所以 αw2αβ2\|\alpha - w\|^2 \geq \|\alpha - \beta\|^2,等号当且仅当 w=βw = \beta

正交投影的计算

W=span(η1,,ηm)W = \operatorname{span}(\eta_1, \ldots, \eta_m)标准正交基 ε1,,εm\varepsilon_1, \ldots, \varepsilon_m,则:

β=i=1m(α,εi)εi\beta = \sum_{i=1}^{m} (\alpha, \varepsilon_i) \, \varepsilon_i

用普通基求投影

WW 的基为 η1,,ηm\eta_1, \ldots, \eta_m,求 α\alphaWW 上的投影 β=xiηi\beta = \sum x_i \eta_i

αβηj\alpha - \beta \perp \eta_jj=1,,mj = 1, \ldots, m):

(β,ηj)=(α,ηj)i=1mxi(ηi,ηj)=(α,ηj)(\beta, \eta_j) = (\alpha, \eta_j) \quad\Longrightarrow\quad \sum_{i=1}^{m} x_i (\eta_i, \eta_j) = (\alpha, \eta_j)

写成矩阵形式:

Gx=b,Gij=(ηi,ηj),bj=(α,ηj)Gx = b, \quad G_{ij} = (\eta_i, \eta_j), \quad b_j = (\alpha, \eta_j)

其中 GG 是基的 Gram 矩阵(对称正定),解方程组即得系数 xx

最小二乘法

问题的提法

不相容线性方程组 Ax=bAx = bARm×nA \in \mathbb{R}^{m \times n}bRmb \in \mathbb{R}^mm>nm > n)。求 xx 使 Axb2\|Ax - b\|^2 最小。

几何理解

AxAx 取遍 AA 的列空间 Col(A)\operatorname{Col}(A)。问题转化为:求 bbCol(A)\operatorname{Col}(A)正交投影

法方程(正规方程)

AxbCol(A)Ax - b \perp \operatorname{Col}(A),得:

A(Axb)=0AAx=AbA^\top (Ax - b) = 0 \quad\Longrightarrow\quad A^\top A x = A^\top b

此即正规方程(Normal Equation)。

最小二乘解的公式

AAA^\top A 可逆(AA 列满秩时一定可逆):

x=(AA)1Abx = (A^\top A)^{-1} A^\top b

(AA)1A(A^\top A)^{-1} A^\top 称为 AAMoore-Penrose 左伪逆

应用

  • 数据拟合(y=a1f1(x)++anfn(x)y = a_1 f_1(x) + \cdots + a_n f_n(x),最小化残差平方和)
  • 线性回归
  • 信号处理中的去噪

小结

概念核心公式
正交投影β=(α,εi)εi\beta = \sum (\alpha, \varepsilon_i) \varepsilon_i
最短距离d=αβd = \|\alpha - \beta\|
正规方程AAx=AbA^\top A x = A^\top b
最小二乘解x=(AA)1Abx = (A^\top A)^{-1} A^\top b