协方差 Covariance
协方差是统计学中描述两个变量如何一起变化的指标。协方差是一个二元变量的统计量,用于衡量两个变量的总体误差。
公式
Cov(X,Y)=n∑i=1n(Xi−Xˉ)(Yi−Yˉ)
其中 X 表示 X 的均值,Y 表示 Y 的均值,n 表示样本数量。
但是常见情况下会考虑期望而不是均值,所以我们可以将公式改写为:
Cov(X,Y)=E[(X−μX)(Y−μY)]
性质
- 协方差是对称的,即 Cov(X,Y)=Cov(Y,X)
- 协方差的绝对值越大,说明两个变量的相关性越强
- 协方差为正时,说明两个变量正相关;协方差为负时,说明两个变量负相关
- 协方差为 0 时,说明两个变量不相关
协方差矩阵
协方差矩阵是一个方阵,对角线上的元素是各个变量的方差,非对角线上的元素是两个变量之间的协方差。
公式
Σ=⎣⎢⎢⎢⎢⎡Var(X1)Cov(X2,X1)⋮Cov(Xn,X1)Cov(X1,X2)Var(X2)⋮Cov(Xn,X2)⋯⋯⋱⋯Cov(X1,Xn)Cov(X2,Xn)⋮Var(Xn)⎦⎥⎥⎥⎥⎤
假设我们有一个 n 维随机变量向量 X=[X1,X2⋯,Xn]T,其均值向量为 μ=[μ1,μ2,…,μn]T,其中 μi=E[Xi]。那么,协方差矩阵Σ 定义为:
Σ=E[(X−μ)(X−μ)T]
其中,Σ 是一个 n×n 的矩阵,其第(i,j)元素为 Xi 和 Xj 的协方差:
Σij=Cov(Xi,Xj)=E[(Xi−μi)(Xj−μj)]