3. 拉格朗日乘子与约束方程

  • 约束方程 constraint set:

    • 形式就是一个隐函数,得到的也就应该是低维空间的一个曲线/面,令 F:RnRF : \R^n\to \R

    • 作用于 form 映射 ff 的约束方程:( f:RnRf: \R^n\to \R )

      • 从康托面分析(俯视图),当约束方程的图形在 ξ\xi 处切线和 ff 康拓面在 ξ\xi 的切线重合则此处是 映射 ff 关于约束方程 FF 的极值点
    • 注:ffFF 约束时得到低维曲线 (ffn+1n+1 维度的空间, FFnmn-m 维度的曲面)曲线与 F(x)=0F(x)=0 空间维度一致

    • 注:ff 作为一个 form 形式的映射,其求导得到的是方向导数, 即在康拓面内指向价值下降最快的地方,而不是在 n+1n+1 维空间延梯度向下;而 DfξDf|_\xi 则表示一个梯度向量乘上另一个向量,结果是一个值, 即 R\R, 在极值点处应为 0

      • C={xRn:F(x)=0}\mathscr{C} = \{x\in \R^n: F(x) = 0\}
  • 表达式:

    • f:ΩR,ΩRnf : \Omega \to \R, \Omega\in \R^n, F:RnRmF: \R^n\to \R^m, C=imf\mathscr{C} = \operatorname{im} f dimC=m\Rightarrow \dim\mathscr{C} = m

    • ΩC:h(x)\Omega \cap\mathscr{C}: h(x) 是一个 mm 维的 hyper 曲面

    • 取出 DFξDF|_\ximm 个线性无关向量(即将一个 n×mn\times m 矩阵变成一个约旦标准矩阵), 则一定存在有一组 λiR\lambda_i\in \R 使得Dfξ+Σi=1mλiDFiξ=0Df|_\xi + \Sigma_{i=1}^m\lambda_i DF_i|_\xi = 0 .

      • 注:FFmm 个线性无关是由隐函数定理推导的,即对于 F(x)=0F(x)=0xRnx\in \R^n,求导得到 DFDF 其中 pp 维线性无关. 取作 v1vpv_1\cdots v_p, 则行列式 det(v1vp)0\det(v_1\cdots v_p) \not=0, 那么就有显函数 g:(vp+1,,vn)(v1vp)g: (v_{p+1}, \cdots , v_n)\to (v_1\cdots v_p) , 也就是说线性无关基可以由线性相关向量映射而来
      • 注:这里 DfDf 并不是以一个整体看作梯度向量,而是按照 if\partial_i f 对每一个维度均成立
    • 矩阵表达: (f+Λm×1Fm×m)ξm=(00)(\nabla f + \Lambda_{m\times 1}\nabla F_{m\times m})\circ \xi_m = \begin{pmatrix}0\\\vdots\\0\end{pmatrix}Fj(x)=0F_j(x) = 0 是一个 n+mn+m 的线性方程组

    • 定义快捷表达式 Ψ(x1,xn,λ1,λm)=f(x)+λ1F1(x)++λmFm(x)\Psi(x_1\cdots,x_n,\lambda_1\cdots,\lambda_m) = f(x) + \lambda_1 F_1(x) +\cdots+\lambda_mF_m(x), 则当函数 DΨξ=0D\Psi|_\xi = 0

      • 这样表示可以把 FF 拆分成 nn 个 form 函数,对之求导必然得到 nn 个上述方程
      • 当然方程式的 Fm×m(x)=0F_{m\times m}(x)= 0 得到的是前 $m $ 维度的零点 ξ\xi' ,即我们考虑问题就是前 mm 维度