矩阵微积分
在数学中,矩阵微积分是多元微积分的一种特殊表达,尤其是在矩阵空间上进行讨论的时候。它把单个函数对多个变量或者多元函数对单个变量的偏导数写成向量和矩阵的形式,使其可以被当成一个整体被处理。這使得要在多元函數尋找最大或最小值,又或是要為微分方程系統尋解的過程大幅簡化。这里我们主要使用统计学和工程学中的惯用记法,而张量下标记法更常用于物理学中。
记法
在本小节中,我们在表示向量和矩阵时,通过用单个变量来表示许多变量的方式,把矩阵记法的效用发挥到最大。接下来我们用不同字体来区分标量、向量和矩阵。我们使用M(n,m)来表示包含n行m列的n×m实矩阵的空间。该空间中的一般矩阵用粗体大写字母表示,例如A,X,Y等。而若该矩阵属于M(n,1),即列向量,则用粗体小写字母表示,如a,x,y等。特别地,M(1,1)中的元素为标量,用小写斜体字母表示,如a,t,x等。XT 表示矩阵转置,tr(X)表示矩阵的迹,而 det(X)或|X|表示行列式。除非专门注明,所有函数都默认属于光滑函数C1。 通常字母表前半部分的字母(a, b, c, …)用于表示常量,而后半部分的字母(t, x, y, …)用于表示变量。
向量求导
由于向量可看成仅有一列的矩阵,最简单的矩阵求导为向量求导。
这里的标记方法可以通过如下方式表达大部分向量微积分:把n维向量构成的空间M(n,1)等同为欧氏空间 Rn, 标量M(1,1)等同于R。对应的向量微积分的概念在每小节末尾列出。
向量对标量求导
这里的“分子布局记法”一般指,在表示导数向量(或矩阵)时,该导数的行数等于导数表达式中处于分子部分的参数维度,即的维度大小;若采用分母布局记法,则导数的行数等于导数表达式中处于分母部分的参数维度,即的维度大小。分子布局记法的结果与分母布局记法的结果互为转置关系。
在向量微积分中,向量关于标量的导数也被称为向量的切向量,。注意这里。
例子 简单的样例包括欧式空间中的速度向量,它是位移向量(看作关于时间的函数)的切向量。更进一步而言, 加速度是速度的切向量。
矩阵求导
有两种类型的矩阵求导可以被写成相同大小的矩阵:矩阵对标量求导和标量对矩阵求导。它们在解决应用数学的许多领域常见的最小化问题中十分有用。类比于向量求导,相应的概念有切矩阵和梯度矩阵。
矩阵对标量求导
矩阵函数Y对标量x的导数被称为切矩阵,(用分子记法)可写成:
參考文獻
延伸閱讀
- Lax, Peter D. . 2nd. Hoboken, N.J.: Wiley-Interscience. 2007. ISBN 978-0-471-75156-4.