本文在四元数体上考虑如下3×3分块双鞍点问题:
其中$ {A\in{SC}^{>}_{m}{(Q)}} $为四元数自共轭正定矩阵, $ {{B\in{Q}^{m\times n}}} $, $ {{D\in{Q}^{n\times p}}} $为四元数列满秩矩阵, $ {{C\in{Q}^{n\times n}}} $为四元数半正定矩阵, $ {{B}^{*}} $为$ B $的共轭转置矩阵, $ {{D}^{*}} $为$ D $的共轭转置矩阵, $ {f\in{Q}^{m}} $, $ {g\in{Q}^{n}} $, $ {h\in{Q}^{p}} $为已知向量且$ {m\geq n\geq p} $, $ {x\in{Q}^{m}} $, $ {y\in{Q}^{n}} $, $ {z\in{Q}^{p}} $是未知向量.
双鞍点问题产生于许多科学计算与工程应用领域, 例如椭圆偏微分方程的混合有限元近似方法[1]、数值求解约束优化问题[2]、液晶建模问题[3]等. 具有3×3块状结构的线性系统(1.1)通过进一步分块划分之后, 形成内外双层鞍点或形似鞍点的新结构, 故称(1.1)为双鞍点系统. 多年来, 关于双鞍点系统的有效求解问题引起一些学者的关注, 并取得相关的研究成果. 2018年文献[4]利用一般迭代方法讨论了双鞍点系统的求解; 2019年文献[5]将经典鞍点问题的shift-splitting预处理子[6]推广到双鞍点问题; 同年文献[7-9]针对双鞍点系统提出了分块对角预处理方法, 讨论了预处理矩阵的特征根分布问题, 将Uzawa方法扩展到求解复数域上的双鞍点系统, 并结合分裂迭代设计出多个实现方法; 2020年文献[10]通过引进两个可变参数的迭代方法来求解双鞍点问题; 最近又有一些学者对双鞍点问题进行了一系列预处理技术等方法的研究[11-13].
然而, 关于四元数体上的鞍点问题, 由于四元数乘法的非交换以及四元数矩阵特征值计算的复杂性, 目前未见相关的研究报导. 但随着四元数在航天器姿态控制、彩色图像恢复、量子物理等方面的广泛应用[14], 相应的技术处理问题也会涉及四元数大型稀疏系统的数值计算, 当然也包括四元数鞍点系统的求解问题. 因此, 把复数域上的鞍点问题推广到四元数体上研究具有重要的实际意义. 本文目的是针对四元数双鞍点系统(1.1), 采用分层Uzawa迭代思想, 构建求解系统(1.1)的混参迭代方法.
容易知道, 方程组(1.1)的系数矩阵$ {\cal A} $是一个满秩方阵, 因此(1.1)存在唯一解. 本节采用求解复数域鞍点问题的Uzawa迭代思想, 构建求解四元数系统(1.1)的分层Uzawa混参迭代方法. 为此, 先对系统(1.1)的系数矩阵作如下划分
记
则3×3分块鞍点系统(1.1)可变成如下形式的鞍点问题:
这里四元数线性系统(2.3)被视为四元数广义单鞍点问题. 虽然3×3分块线性系统(1.1)可以转化为线性系统(2.3), 但(2.3)中的矩阵$ E $不再是自共轭正定矩阵, 因此经典单鞍点问题的迭代方法不能直接应用到(2.3), 只能另辟蹊径. 显然, 系统(2.3)等价于方程组
下面采用Uzawa迭代思想进行讨论. 在系统(2.3)中, 因为矩阵$ A $是自共轭正定矩阵, $ B $为四元数列满秩矩阵, $ C $是四元数半正定矩阵, 故由矩阵理论可知$ E $是非奇异的[15]. 根据(2.4)我们将Uzawa迭代方法应用于系统(2.3), 则可构建出求解(2.3)的如下迭代:
其中$ \tau>0 $是实参数, $ P $为参数正定矩阵, $ {v^{(k)}}={{\rm{((}}x{}^{(k)}{)^T},{{\rm{(}}y{}^{(k)})^T})^T} $.
从迭代(2.5)可以看出, 该迭代将系统(1.1)分成了两部分, 第一部分是由矩阵$ E,F,w $构成(2.4)中第一个矩阵方程的迭代, 第二部分是由矩阵$ F,h $及参数$ \tau,P $构成(2.4)中第二个矩阵方程的迭代. 从计算角度来看, 要想计算出迭代(2.5)中的$ {z^{(k+1)}} $, 就要先计算出$ {v^{(k+1)}} $, 而$ {v^{(k+1)}} $的求解可视为求解一个广义鞍点问题$ Ev=w-Fz. $格式(2.5)体现出分层迭代思想, 因此称(2.5)为四元数双鞍点问题(1.1)的分层Uzawa迭代, 简称Q-Uzawa迭代.
为方便分析迭代(2.5)的收敛性, 利用四分块矩阵的求逆公式, 先计算出四元数矩阵$ E $的逆矩阵如下
于是, 迭代(2.5)的第一个等式可以表示为
因此由(2.6)和(2.7)可得
再根据迭代(2.5)的第二个式子, 有
于是迭代(2.5)等价于
其中$ \tau>0 $是实参数, $ P $为待定的四元数正定矩阵. 记
则迭代(2.10)又可简洁地写为
这里迭代(2.12)的迭代矩阵可表示为
矩阵(2.13)正是Q-Uzawa迭代的迭代矩阵.
本节主要讨论所构建的Q-Uzawa迭代(2.12)的收敛性. 显然, 迭代(2.12)收敛当且仅当其迭代矩阵的谱值半径$ \rho(\Lambda )<1 $.根据迭代(2.12)中$ \Lambda $的表达式可知
为导出迭代(2.12)的收敛条件, 我们先给出以下定义和引理.
定义3.1[15] 设$ A\in{{{Q}}^{n\times n}} $, 且$ A $分块为
其中$ {A_k}\in{Q^{k\times k}},{A_{n-k}}\in {Q^{(n-k) \times(n-k)}} $, 若$ {A_k} $可逆, 则称$ A/{A_k}\buildrel \Delta\over={A_{n-k}}-CA_k^{-1}B \in {Q^{(n-k)\times(n-k)}} $为$ A $关于它的$ k $阶顺序主子阵$ {A_k} $的Schur补.
引理3.1[15] 设$ {A\in{SC}^{>}_{n}{(Q)}} $, 则$ A $的任意$ k $$ (1\le k\le n-1) $阶顺序主子式$ {A_k} $及$ {A_k} $的Schur补$ A/{A_k} $都是正定的.
下面我们给出Q-Uzawa迭代(2.12)收敛的条件. 对于系统(1.1)中给定的矩阵$ A $, $ B $, $ C $, $ D $和迭代(2.12)引入的参数正定矩阵$ P\in{Q^{p{\rm{\times}}p}} $, 记
其中$ H=C{\rm{+}}{B^*}{A^{-1}}B. $
定理3.1 设$ A \in SC_m^>(Q),C \in SC_n^\ge(Q) $, $ B\in {Q^{m\times n}} $和$ D \in {Q^{n{\rm{ \times }}p}} $为四元数列满秩矩阵, $ P\in SC_p^>(Q) $为待定的四元数正定矩阵. 如果参数$ \tau $满足
其中$ Q={P^{-1}}{D^{\rm{*}}}{H^{-1}}D\in {Q^{p\times p}} $由(3.2)给出, 则Q-Uzawa迭代(2.12)收敛.
证 由定义3.1可得$ H=C{\rm{+}}{B^*}{A^{-1}}B $是矩阵$ E $的Schur补, 且由引理3.1可知矩阵$ H\in SC_n^>(Q) $. 假设$ {\lambda _i} $是矩阵$ Q={P^{-1}}{D^{\rm{*}}}{H^{-1}}D $的任意一个特征值, 因为矩阵$ Q $与矩阵$ {P^{1{\rm{/}}2}}Q{P^{-1/2}} $相似, 故矩阵$ Q $和矩阵$ {P^{1{\rm{/}}2}}Q{P^{-1/2}} $有相同的特征值. 又因为$ D\in{Q^{n{\rm{\times}}p}} $为列满秩矩阵, $ {H^{-1}}\in SC_n^>(Q) $, 所以$ {D^{\rm{*}}}{H^{-1}}D\in SC_p^>(Q) $, 于是有
从而$ {\lambda _i}>0 $.因此由(3.1)可知
由(3.5)解得
由于实值函数$ f(x)=\frac{2}{x}(x>0) $在$ (0,+\infty) $是单调递减函数, 所以当$ {\lambda_i}={\lambda_{\max}}(Q) $时, $ f(x) $有最小值. 于是当$ \tau $满足不等式(3.3)时必有$ \rho(\Lambda)<1 $, 即Q-Uzawa迭代(2.12)收敛. 证毕.
在构建迭代(2.12)时, 我们引进了一个参数$ \tau $和一个参数正定矩阵$ P\in SC_p^>(Q) $, 因此如何选取参数$ \tau $及矩阵$ P $, 使得迭代(2.12)能够达到理想的收敛效果, 是算法实现的重要一步. 对此我们有必要进一步讨论参数的选取问题.
首先, 关于参数正定矩阵$ P $的选取, 需考虑如下原则:①$ {P^{-1}} $易于计算; ②矩阵$ P $尽可能与矩阵$ A,B,C,D $相关联; ③若想迭代收敛速度更快, 需考虑迭代矩阵的谱值半径尽可能的小, 即$ \rho(I-\tau {P^{-1}}{D^{\rm{*}}}{(C{\rm{+ }}{B^*}{A^{-1}}B)^{-1}}D) $尽可能小, 这等价于$ P\approx\tau {D^{\rm{*}}}{(C{\rm{+}}{B^*}{A^{-1}}B)^{-1}}D. $根据这3个原则, 我们选择
其中$ k\ge 0,\delta\ge 0 $, 使得矩阵$ P $与系数矩阵关联性强, 且易于计算, 这里$ k,\delta $的作用是调控矩阵$ Q $的特征值大小.
其次, 是关于参数$ \tau $的选取问题. 当我们选定参数正定矩阵$ P $后, 可根据定理3.1中$ \tau $的取值范围(3.3)来选取参数$ \tau $, 即在估计出矩阵$ Q $的最大特征值之后, 就可得出参数$ \tau $的取值范围. 从而运用迭代(2.10)实现对系统(1.1)的迭代求解.
最后是关于算法实现问题. 设$ A={A_1}+{A_2}j\in {Q^{m\times n}}, $则$ A $的复表示矩阵为[15]
利用四元数矩阵的复表示及其运算性质, 易知迭代(2.10)等价于下列复数域$ \mathbb{C} $上的迭代:
在实际运算中, 由于四元数乘法不满足交换律, 因此在MATLAB环境运行时可按照迭代格式(4.2)进行计算. 最后是迭代解的还原, 即
(4.3)中右边式子即为原系统(1.1)的第$ k $次数值解.
在这一节中, 我们给出2个数值例子作测试实验, 以检验所给四元数双鞍点问题的Q-Uzawa迭代方法的有效性.
假设迭代步数为IT, 运算满足收敛要求所需时间记为CPU(秒), 选取初始向量为零向量, 将右侧向量设置为
在本文的数值实验中, 所有迭代都在个人计算机上的MATLAB(R2022a)中运行, 并且当迭代的残差值满足$ {\rm{RES(}}k{\rm{)<1}}{{\rm{0}}^{-6}} $或者迭代次数超过1000次时终止, 其中迭代误差$ {\rm{RES(}}k{\rm{)}} $定义为
例5.1 在四元数体上考虑如下3×3分块双鞍点问题, 其系数矩阵分别为:
$ A={\left({\begin{array}{*{20}{c}} {150}&{25i+10k}&{}&{}&{}&{}&{}\\ {-25i-10k}&{150}&{25i+10k}&{}&{}&{}&{}\\ {}&{-25i-10k}&{150}&{25i+10k}&{}&{}&{}\\ {}&{}&{-25i-10k}&{150}&{25i+10k}&{}&{}\\ {}&{}&{}&{-25i-10k}&{150}&\ddots &{}\\ {}&{}&{}&{}&\ddots &\ddots &{25i + 10k}\\ {}&{}&{}&{}&{}&{-25i-10k}&{150} \end{array}}\right)_{m\times m}}, $
$ B={\left({\begin{array}{*{20}{c}} {75+45i}&{}&{}&{}&{}\\ {60i+50k}&{75+45i}&{}&{}&{}\\ 0&{60i+50k}&{75+45i}&{}&{}\\ {}&0&{60i+50k}&\ddots&{}\\ {}&{}&0&\ddots&{75+45i}\\ {}&{}&{}&\ddots&{60i+50k}\\ {}&{}&{}&{}&0 \end{array}} \right)_{m \times n}},C{\rm{=}}{\left({\begin{array}{*{20}{c}} {85}&{-30i}&{}&{}&{}\\ {30i}&{85}&{-30i}&{}&{}\\ {}&{30i}&{85}&\ddots &{}\\ {}&{}&\ddots &\ddots&{-30i}\\ {}&{}&{}&{30i}&{85} \end{array}}\right)_{n\times n}}, $
$ D{\rm{=}}{\left({\begin{array}{*{20}{c}} {80{\rm{+}}70j}&{}&{}&{}\\ {60i+90k}&{80{\rm{+}}70j}&{}&{}\\ {}&{60i+90k}&\ddots &{}\\ {}&{}&\ddots&{80{\rm{+}}70j}\\ {}&{}&{}&{60i+90k} \end{array}}\right)_{n\times p}}. $
首先, 由四元数矩阵的分解式$ A={A_1}+{A_2}j,B={B_1}+{B_2}j,C={C_1}+{C_2}j,D ={D_1}+{D_2}j $得它们的复表示矩阵$ {A^\sigma},{B^\sigma},{C^\sigma},{D^\sigma } $, 其中
$ {A_1}={\left({\begin{array}{*{20}{c}} {150}&{25i}&{}&{}&{}&{}&{}\\ {-25i}&{150}&{25i}&{}&{}&{}&{}\\ {}&{-25i}&{150}&{25i}&{}&{}&{}\\ {}&{}&{-25i}&{150}&{25i}&{}&{}\\ {}&{}&{}&{-25i}&{150}&\ddots &{}\\ {}&{}&{}&{}&\ddots &\ddots &{25i}\\ {}&{}&{}&{}&{}&{-25i}&{150} \end{array}}\right)_{m\times m}}, $
$ {A_2}={\left({\begin{array}{*{20}{c}} 0&{10i}&{}&{}&{}&{}&{}\\ {-10i}&0&{10i}&{}&{}&{}&{}\\ {}&{-10i}&0&{10i}&{}&{}&{}\\ {}&{}&{-10i}&0&{10i}&{}&{}\\ {}&{}&{}&{-10i}&0&\ddots &{}\\ {}&{}&{}&{}& \ddots &\ddots&{10i}\\ {}&{}&{}&{}&{}&{-10i}&0 \end{array}}\right)_{m \times m}}, $
$ {B_1}={\left({\begin{array}{*{20}{c}} {75+45i}&{}&{}&{}&{}\\ {60i}&{75+45i}&{}&{}&{}\\ 0&{60i}&{75+45i}&{}&{}\\ {}&0&{60i}&\ddots &{}\\ {}&{}&0&\ddots&{75+45i}\\ {}&{}&{}&\ddots&{60i}\\ {}&{}&{}&{}&0 \end{array}}\right)_{m\times n}},{B_2}={\left({\begin{array}{*{20}{c}} 0&{}&{}&{}&{}\\ {50i}&0&{}&{}&{}\\ 0&{50i}&0&{}&{}\\ {}&0&{50i}&\ddots &{}\\ {}&{}&0&\ddots &0\\ {}&{}&{}&\ddots &{50i}\\ {}&{}&{}&{}&0 \end{array}} \right)_{m\times n}}, $
$ {C_1}{\rm{=}}{\left( {\begin{array}{*{20}{c}} {85}&{-30i}&{}&{}&{}\\ {30i}&{85}&{-30i}&{}&{}\\ {}&{30i}&{85}& \ddots &{}\\ {}&{}& \ddots & \ddots &{-30i}\\ {}&{}&{}&{30i}&{85} \end{array}} \right)_{n \times n}},{C_2}={\left({\begin{array}{*{20}{c}} 0&0&{}&{}&{}\\ 0&0&0&{}&{}\\ {}&0&0&\ddots&{}\\ {}&{}&\ddots&\ddots &0\\ {}&{}&{}&0&0 \end{array}} \right)_{n \times n}}, $
$ {D_1}{\rm{=}}{\left({\begin{array}{*{20}{c}} {80}&{}&{}&{}\\ {60i}&{80}&{}&{}\\ {}&{60i}& \ddots &{}\\ {}&{}& \ddots &{80}\\ {}&{}&{}&{60i} \end{array}}\right)_{n\times p}},{D_2}{\rm{=}}{\left({\begin{array}{*{20}{c}} {70}&{}&{}&{}\\ {90i}&{70}&{}&{}\\ {}&{90i}& \ddots &{}\\ {}&{}& \ddots &{70}\\ {}&{}&{}&{90i} \end{array}}\right)_{n\times p}}. $
其次, 选取不同的参数矩阵$ P $进行计算. ①选$ P=(1/2){D^{\rm{*}}}{B^*}{A^{-1}}BD\buildrel\Delta\over={P_a} $代入(2.10)有
再将Q-Uzawa迭代格式代入等价形式(4.2)计算, 得如下计算结果.
② 选取$ P=0.01\cdot{D^{\rm{*}}}D\buildrel\Delta\over={P_b} $作为参数矩阵, 代入(2.10)有
例5.2在四元数体上考虑如下3×3分块双鞍点问题, 其系数矩阵分别为:
$ A={\left({\begin{array}{*{20}{c}} {255}&{70i{\rm{+}}100k}&{}&{}&{}&{}&{}\\ {-70i-100k}&{255}&{70i{\rm{+}}100k}&{}&{}&{}&{}\\ {}&{-70i-100k}&{255}&{70i{\rm{+}}100k}&{}&{}&{}\\ {}&{}&{-70i-100k}&{255}&{70i{\rm{+}}100k}&{}&{}\\ {}&{}&{}&{-70i-100k}&{255}& \ddots &{}\\ {}&{}&{}&{}&\ddots &\ddots &{70i{\rm{+}}100k}\\ {}&{}&{}&{}&{}&{-70i-100k}&{255} \end{array}} \right)_{m\times m}}, $
$ B={\left({\begin{array}{*{20}{c}} {120+100i}&{}&{}&{}&{}\\ {75i+65k}&{120+100i}&{}&{}&{}\\ 0&{75i+65k}&{120+100i}&{}&{}\\ {}&0&{75i+65k}& \ddots &{}\\ {}&{}&0&\ddots &{120+100i}\\ {}&{}&{}&\ddots &{75i+65k}\\ {}&{}&{}&{}&0 \end{array}}\right)_{m\times n}}, $
$ C{\rm{=}}{\left({\begin{array}{*{20}{c}} {60}&{-30i}&{}&{}&{}\\ {30i}&{60}&{-30i}&{}&{}\\ {}&{30i}&{60}&\ddots &{}\\ {}&{}&\ddots &\ddots &{-30i}\\ {}&{}&{}&{30i}&{60} \end{array}}\right)_{n\times n}}, $$ D={\left({\begin{array}{*{20}{c}} {100{\rm{+}}80j}&{}&{}&{}\\ {60i+70k}&{100{\rm{+}}80j}&{}&{}\\ {}&{60i+70k}&\ddots &{}\\ {}&{}&\ddots&{100{\rm{+}}80j}\\ {}&{}&{}&{60i+70k} \end{array}}\right)_{n\times p}}. $
首先, 由四元数矩阵的分解式$ A={A_1}+{A_2}j,B={B_1}+{B_2}j,C={C_1}+{C_2}j,D ={D_1}+{D_2}j $得它们的复表示矩阵$ {A^\sigma},{B^\sigma },{C^\sigma},{D^\sigma} $, 其中
$ {A_1}={\left({\begin{array}{*{20}{c}} {255}&{70i}&{}&{}&{}&{}&{}\\ {-70i}&{255}&{70i}&{}&{}&{}&{}\\ {}&{-70i}&{255}&{70i}&{}&{}&{}\\ {}&{}&{-70i}&{255}&{70i}&{}&{}\\ {}&{}&{}&{-70i}&{255}&\ddots &{}\\ {}&{}&{}&{}&\ddots&\ddots &{70i}\\ {}&{}&{}&{}&{}&{-70i}&{255} \end{array}}\right)_{m \times m}}, $
$ {A_2}={\left({\begin{array}{*{20}{c}} 0&{100i}&{}&{}&{}&{}&{}\\ {-100i}&0&{100i}&{}&{}&{}&{}\\ {}&{-100i}&0&{100i}&{}&{}&{}\\ {}&{}&{-100i}&0&{100i}&{}&{}\\ {}&{}&{}&{-100i}&0&\ddots &{}\\ {}&{}&{}&{}&\ddots&\ddots &{100i}\\ {}&{}&{}&{}&{}&{-100i}&0 \end{array}}\right)_{m\times m}}, $
$ {B_1}={\left({\begin{array}{*{20}{c}} {120+100i}&{}&{}&{}&{}\\ {75i}&{120+100i}&{}&{}&{}\\ 0&{75i}&{120+100i}&{}&{}\\ {}&0&{75i}&\ddots &{}\\ {}&{}&0&\ddots &{120+100i}\\ {}&{}&{}& \ddots &{75i}\\ {}&{}&{}&{}&0 \end{array}}\right)_{m\times n}},{B_2}={\left({\begin{array}{*{20}{c}} 0&{}&{}&{}&{}\\ {65i}&0&{}&{}&{}\\ 0&{65i}&0&{}&{}\\ {}&0&{65i}& \ddots &{}\\ {}&{}&0& \ddots &0\\ {}&{}&{}& \ddots &{65i}\\ {}&{}&{}&{}&0 \end{array}} \right)_{m \times n}}, $
$ {C_1}{\rm{=}}{\left({\begin{array}{*{20}{c}} {60}&{-30i}&{}&{}&{}\\ {30i}&{60}&{-30i}&{}&{}\\ {}&{30i}&{60}&\ddots &{}\\ {}&{}&\ddots &\ddots &{-30i}\\ {}&{}&{}&{30i}&{60} \end{array}}\right)_{n\times n}}, $ $ {C_2}={\left({\begin{array}{*{20}{c}} 0&0&{}&{}&{}\\ 0&0&0&{}&{}\\ {}&0&0&\ddots&{}\\ {}&{}&\ddots&\ddots &0\\ {}&{}&{}&0&0 \end{array}}\right)_{n\times n}}, $
$ {D_1}{\rm{ = }}{\left( {\begin{array}{*{20}{c}} {100}&{}&{}&{}\\ {60i}&{100}&{}&{}\\ {}&{60i}& \ddots &{}\\ {}&{}& \ddots &{100}\\ {}&{}&{}&{60i} \end{array}} \right)_{n \times p}}, $ $ {D_2}{\rm{ = }}{\left( {\begin{array}{*{20}{c}} {80}&{}&{}&{}\\ {70i}&{80}&{}&{}\\ {}&{70i}& \ddots &{}\\ {}&{}& \ddots &{80}\\ {}&{}&{}&{70i} \end{array}} \right)_{n \times p}} $.
其次, 选取不同的参数矩阵$ P $进行计算. ①选取$ P=0.01\cdot{D^{\rm{*}}}D\buildrel\Delta\over={P_c} $作为参数矩阵, 代入(2.10)有
② 选取$ P=(1{\rm{/}}2){D^{\rm{*}}}{B^*}{A^{-1}}BD\buildrel\Delta\over={P_d} $作为参数矩阵, 代入(2.10)有
从表 1-表 4的结果可知, 对不同的双鞍点系数矩阵$ {\cal A} $, 当选取合适的参数$ \tau $和参数正定矩阵$ P $时, 所建立的分层Q-Uzawa迭代对求解系统(1.1)可达到理想的收敛效果.
本文在四元数体上讨论3×3块状双鞍点系统(1.1)的求解问题. 通过将双鞍点系统进行2×2分块划分, 形成一个广义鞍点问题, 再运用分层迭代思想, 构建出求解该广义鞍点问题的Q-Uzawa迭代, 同时运用四元数矩阵的特征值理论, 证明了Q-Uzawa迭代在参数$ \tau $及参数矩阵$ P $满足定理3.1条件下的收敛性, 该结论对参数矩阵$ P $的选取有较大的灵活性. 最后给出了参数矩阵$ P $的选取方法, 并运用四元数矩阵复表示获得适应MATLAB环境的算法实现过程, 2个数值算例检验了Q-Uzawa迭代的有效及可行性.