矩阵指数
矩阵指数(matrix exponential)是方块矩阵的一种矩阵函数,与指数函数类似。矩阵指数给出了矩阵李代数与对应的李群之间的关系。
设X为n×n的实数或复数矩阵。X的指数,用eX或exp(X)来表示,是由以下幂级数所给出的n×n矩阵:
以上的级数总是收敛的,因此X的指数是定义良好的。注意,如果X是1×1的矩阵,则X的矩阵指数就是由X的元素的指数所组成的1×1矩阵。
性质
基本性质
设X和Y为n×n的复数矩阵,并设a和b为任意的复数。我们把n×n的单位矩阵记为I,把零矩阵记为0。
我们可以从指数级数的定义直接得到矩阵指数的如下性质[1]:
- e0 = I
- exp(XT) = (exp X)T,其中XT表示X的转置。从中可以推出,如果X是对称矩阵,则eX也是对称矩阵;如果X是斜对称矩阵,则eX是正交矩阵。
- 如果Y是可逆矩阵,那么 eYXY−1 = YeXY−1
接下来是一个关键性质:
- 如果那么
由此导出的推论有:
- eaXebX = e(a + b)X
- eXe−X = I
线性微分方程
矩阵指数的一个重要性,是它可以用来解微分方程。从(1)可知,以下微分方程
其中A是矩阵,具有解
矩阵指数也可以用来解非齐次方程:
参见以下的例子。
当A不是常数时,以下形式的微分方程没有闭式解:
但马格努斯级数可以给出无穷级数形式的解。
指数相加
我们知道,对于任何实数(标量)x和y,指数函数都满足公式ex + y = exey。类似的等式对于可交换矩阵也成立:如果矩阵X和Y是可交换的(即XY = YX),则:
但是,如果它们不是可交换的,则以上的等式不一定成立。
这个命题反过来不成立:eX+Y=eXeY并不一定就意味着X和Y是可交换的。但是,如果X和Y只含有代数数,而且它们的大小至少为2×2,则反过来也成立[3]。
X和Y不可交换的情况可以用以下方法计算:
贝克尔-坎贝尔-豪斯多夫公式
从另一个方向讲,如果和是元素足够小(但不一定可交换)的矩阵,我们有:
其中可以通过和的交换子的级数(贝克尔-坎贝尔-豪斯多夫公式)来计算:[5]
其中余项均为与和相关的迭代交换子。
指数映射
注意矩阵的指数总是非奇异方阵。eX的逆矩阵由e−X给出。这与复数的指数总是非零的事实类似。这样,矩阵指数就给出了一个映射:
这是从所有n×n矩阵的空间到一般线性群(所有非奇异方阵所组成的群)的映射。实际上,这个映射是满射,就是说每一个非奇异方阵都可以写成某个矩阵的指数。矩阵对数就是这个映射的逆映射。
对于任何两个矩阵X和Y,我们有:
其中|| · ||表示任意的矩阵范数。从中可以推出,指数映射在Mn(C)的紧子集内是连续和利普希茨连续的。
以下的映射
定义了一般线性群中的一条光滑曲线,当t = 0时穿过单位元。实际上,这给出了一般线性群的一个单参数子群,这是由于:
这条曲线在点t的导数(或切向量)由以下等式给出:
t = 0时的导数就是矩阵X,所以我们可以说,X是这个单参数子群的推广。
更加一般地:
矩阵指数的计算
找到可靠而准确的方法来计算矩阵指数是很困难的,这仍然是目前数学和数值分析领域的一个重要研究课题。Matlab、GNU Octave和SciPy都使用帕德近似。[6][7][8] 在本节中,我们讨论了原则上适用于任何矩阵的方法,并且可以对小矩阵进行显式处理。[9] 随后的章节描述了适合对大矩阵进行数值评估的方法。
计算
假设我们想要计算以下矩阵的指数。
它的若尔当型为:
其中矩阵P由下式给出:
我们首先来计算exp(J)。我们有:
1×1矩阵的指数仅仅是该矩阵的元素的指数,因此exp(J1(4)) = [e4]。的指数可以用以上提到的公式exp(λ+N) = eλ exp(N)来算出:
因此,原矩阵B的指数为:
应用
线性微分方程
矩阵指数在解线性微分方程时十分有用。前面曾提到,以下形式的微分方程
具有解eCty(0)。如果我们考虑以下向量
我们就可以把线性微分方程表示为:
如果我们作一个猜想,把两边乘以一个积分因子 e−At,便得到:
如果我们可以计算eAt,那么就得到了微分方程的解。
例子(齐次)
假设我们有以下的微分方程组:
相关的矩阵为:
在以上的例子中,我们计算了矩阵指数
因此微分方程组的通解为:
也就是说,
非齐次的情况──参数变换
对于非齐次的情况,我们可以用积分因子的方法(类似于参数变换的方法)。我们找到形为yp(t) = exp(tA)z(t)一个特解:
为了让yp为方程的解,必须有:
因此,
其中c由问题的初始条件决定。
例子(非齐次)
假设我们有以下的微分方程组:
那么我们有
以及
用前面的方法,我们可以得出齐次微分方程的解。由于齐次方程的通解与非齐次方程的特解的和就是非齐次方程的通解,因此我们只需要找到一个特解(用参数变换法)。
我们有:
进一步简化,就可以得到原方程的特解。
註釋
- Hall 2015 Proposition 2.3
- Hall 2015 Theorem 2.12
- (Horn & Johnson 1991,pp.435–437)
- Hall 2015 Theorem 2.11
- Hall 2015 Chapter 5
- . Mathworks. 2011-04-30 [2013-06-05]. (原始内容存档于2012-07-30).
- . Network-theory.co.uk. 2007-01-11 [2013-06-05]. (原始内容存档于2015-05-29).
- . The SciPy Community. 2015-01-18 [2015-05-29].
- 见Hall 2015 。2.2节
参考文献
- Horn, Roger A.; Johnson, Charles R., , Cambridge University Press, 1991, ISBN 978-0-521-46713-1.
- Moler, Cleve; Van Loan, Charles F., (PDF), SIAM Review, 2003, 45 (1): 3–49 [2008-08-14], ISSN 1095-7200, (原始内容存档 (PDF)于2008-12-08).