半向量二层规划是下层包含多个目标函数, 且上层只有单个目标函数的一类二层规划问题(NP-难问题), 其一般的数学模型可以表述为:
其中, $ x\in R^{n}, y\in R^{m} $分别为上、下层决策变量, $ F:R^{n}\times R^{m}\rightarrow R, f:R^{n}\times R^{m}\rightarrow R^{p} $分别为上、下层目标函数, 而$ g:R^{n}\times R^{m}\rightarrow R^{l} $为约束函数.
半向量二层规划问题最早由Bonnel[1, 2]提出, 并对其最优性条件和罚函数方法进行了研究. 随后, 国内外研究者对各类半向量二层规划问题从理论和可行求解算法等方面进行了较为深入的研究.
对下层为线性向量优化的半向量二层规划问题, 任爱红和王宇平[3]首先利用下层问题的边缘函数以及线性规划的对偶理论构造了原问题的罚问题, 然后在偏静态条件下分析了罚问题的精确性, 最后给出了罚函数算法以及数值实验结果; 随后, Ren和Wang[4]基于线性多目标规划的相关转化方法和线性规划的对偶理论将其转化为含对偶间隙约束条件的单层优化问题, 然后将对偶间隙约束条件进行松弛, 构造出对偶间隙指标函数并取其为罚项, 最后证明了罚函数的精确性并给出了精确罚函数算法以及数值实验结果; Lv和Wan[5]首先采用下层问题的最优值转化方法将该类半向量二层规划问题转化为相应的非光滑优化问题, 然后对其可行域进行松弛并逐步收缩, 直至逼近原问题的可行域, 并在此基础上设计了相应的求解算法, 同时利用数值实验结果验证了算法的可行、有效性.
对下层为凸向量优化的半向量二层规划问题, Dempe等[6]首先采用标量化方法将其转化为二层单目标规划问题(上、下层均为单目标), 然后采用下层问题的最优值转化方法将其转化为非光滑优化问题, 最后利用相关非光滑分析方法得到了原问题“乐观最优解”的一阶必要性条件; Gadhi和EIidrissi[7]基于下层问题的标量化和最优值转化方法, 并结合集合的指示函数, 构造了与原问题等价的非光滑单层规划问题, 同时得到了最优性一阶必要条件; Bonnel和Morgan[8]建立了原问题的“乐观最优解”与采用加权标量化方法转化得到的二层单目标规划问题最优解之间的等价关系, 同时证明了原问题的“乐观最优解”与相应二层单目标规划问题的某个权重相对应, 并研究了其“乐观最优解”的存在性条件; 另外, 在笔者前期相关工作中[9], 基于相关标量化方法以及下层问题的最优性条件构造了原问题的罚问题, 并在全线性(各层目标函数与约束函数均为线性函数)情形下给出了适合算法设计的最优性条件.
对下层为非凸向量优化的半向量二层规划问题, Lafhim[10]采用以下层向量优化的目标函数构造加权约束函数的方式, 将其转化为一般的非凸二层规划问题, 同时采用最优值函数转化方法, 将其转化为单层优化问题, 进而基于Mordukhovich广义微分得到了最优性一阶必要条件.
值得指出的是, 目前有关半向量二层规划问题可行求解算法的研究, 更多的集中于线性的情况, 即上、下层目标函数和约束函数均为线性函数. 而对于非线性半向量二层规划问题, 更多的局限于最优性条件方面的研究.
本文将着重研究一类结构较为特殊的非线性半向量二层规划问题, 即非线性-线性半向量二层规划问题, 较为有效的数值求解方法. 所考虑的非线性-线性半向量二层规划问题的数学模型可以表述为,
其中, $ F:R^{n}\times R^{m}\rightarrow R $为连续可微函数, $ x\in R^{n}, y\in R^{m}, D\in R^{p\times m}, b\in R^{l}, A\in R^{l\times n}, B\in R^{l\times m} $. 对上述问题(1.2), 首先以下层问题的Karush-Kuhn-Tucker(K-K-T) 最优性条件代替下层问题, 同时取互补约束条件为上层目标函数的罚项, 构造相应的罚问题; 其次分析罚问题最优解的相关特征, 同时得出解的最优性条件; 然后给出相应的罚函数算法, 并以相关算例验证算法的可行、有效性.
在本文接下来的内容中, 将首先给出问题(1.2) 的转化方法, 同时构造相应的罚问题. 在本文的第3节将分析罚问题的相关性质、罚问题最优解的特征和最优性条件. 第4节将给出罚函数算法以及相关算例. 最后对论文进行小结.
在上述非线性-线性半向量二层规划问题中, 记$ S=\{(x, y)\in R_{+}^{n}\times R_{+}^{m}:Ax+By\leq b\} $为问题(1.2) 的约束域, $ Y(x)=\{y\in R_{+}^{m}:Ax+By\leq b\} $为下层问题
的可行域, 而$ X(y)=\{x\in R_{+}^{n}|\exists y\in R_{+}^{m}, Ax+By\leq b\} $为$ S $在上层决策空间中的投影. 为了保证问题(1.2) 存在最优解, 假设如下条件满足:
$ {\mathit{(A)}} $ 约束域$ S $为非空紧集.
对于给定的上层决策变量$ x $, 记$ S(x) $为上述下层问题(2.1) 的弱有效解集, 则问题(1.2) 可以表述为
由线性多目标规划的相关理论可知[11], 对于给定的上层决策变量$ x $, $ y $为问题(2.1) 的弱有效解, 当且仅当存在$ \lambda\in \Omega=\{\lambda\in R_{+}^{p}: \sum\limits_{i=1}^{p}\lambda_{i}=1\} $, 使得$ y $为如下问题(2.2) 的最优解,
进一步, 将下层目标函数的权重系数$ \lambda $视为上层问题的决策变量, 同时记$ \psi(x, \lambda) $为问题(2.2) 的最优解集, 则对于任意给定的$ (x, \lambda)\in X(y)\times \Omega $, 有如下结果.
定理2.1[6] 假设条件$ (A) $满足, 则有$ S(x)=\psi(x, \Omega):=\bigcup\{\psi(x, \lambda):\lambda\in \Omega\}. $
由定理2.1, 非线性-线性半向量二层规划问题(1.2) 可以转化为如下二层规划问题,
对于得到的二层规划问题(2.3), 以下层问题的K-K-T最优性条件代替下层问题[12], 可以得到如下单层优化问题,
其中, $ \mu\in R^{l} $, $ \nu\in R^{m} $分别为相应的拉格朗日乘子.
问题(2.4) 为含互补约束的优化问题, 也是非凸、不可微优化问题. 为了便于问题的求解, 类似于文献[13]中罚问题的构造方法, 考虑将互补约束作为目标函数的罚项, 构造如下罚问题,
其中, $ M\in R_{+} $为充分大的罚因子. 在接下来的内容中, 我们将着重分析罚问题(2.5) 的最优解特征以及最优性条件, 为后续的算法设计奠定基础.
为了便于问题的讨论, 先给出如下记号.
记$ Z=\{(x, y)\in R_{+}^{n}\times R_{+}^{m}:Ax+By\leq b\} $, $ W=\{(\lambda, \mu, \nu)\in R_{+}^{p}\times R_{+}^{l}\times R_{+}^{m}:\sum\limits_{i=1}^{p}\lambda_{i}=1, -\lambda^{T}D+\mu^{T}B-\nu^{T}=0\} $, 且$ W_{v} $表示多面体$ W $的顶点集. 记
关于问题(2.5) 的最优解, 有如下结果.
定理3.1 假设条件$ (A) $满足且$ M\in R_{+} $, 则问题$ \max\limits_{(\lambda, \mu, \nu)\in W}Q_{M}(\lambda, \mu, \nu) $的最优解$ (\lambda^{*}, \mu^{*}, \nu^{*})\in W_{v} $.
证 首先证明函数$ Q_{M}(\lambda, \mu, \nu) $为凸函数. 事实上, 对任意的$ (\lambda_{1}, \mu_{1}, \nu_{1}), (\lambda_{2}, \mu_{2}, \nu_{2})\in W $, $ \xi\in (0, 1) $, 有
即函数$ Q_{M}(\lambda, \mu, \nu) $为凸函数. 又由于$ W $为多面体, 故问题$ \max\limits_{(\lambda, \mu, \nu)\in W}Q_{M}(\lambda, \mu, \nu) $的最优解$ (\lambda^{*}, \mu^{*}, \nu^{*}) $可以在$ W $的某个顶点处取得.
以上定理3.1给出了相关问题最优解的特征, 下面的结果表明对于问题(2.5), 存在有限的罚因子$ M_{1} $, 当$ M\geq M_{1} $时, 罚项在其最优解处为零.
定理3.2 假设条件$ (A) $满足, 且$ \{(x^{M}, y^{M}, \lambda^{M}, \mu^{M}, \nu^{M})\} $为问题(2.5) 相应于罚因子$ M\in R_{+} $的最优解序列, 那么存在$ M_{1}\in R_{+} $, 使得当$ M\geq M_{1} $时, $ (\mu^{M})^{T}(b-Ax^{M}-By^{M})+(\nu^{M})^{T}y^{M}=0 $.
证 假设$ (x^{*}, y^{*}, \lambda^{*}) $为问题(2.3) 的最优解, 则存在$ (\mu^{*}, \nu^{*}) $使得问题(2.3) 的下层问题的最优性条件满足, 则有
若$ \{(x^{M}, y^{M}, \lambda^{M}, \mu^{M}, \nu^{M})\} $为问题(2.5) 相应于罚因子$ M\in R_{+} $的最优解, 则有
从而有,
其中, $ m $为有限常数. 又由于问题(2.5) 的最优解可以在$ W $的某个顶点处取得, 且$ Z $为非空紧集, 故存在某个$ M_{1}\in R_{+} $, 使得当$ M\geq M_{1} $时, $ (\mu^{M})^{T}(b-Ax^{M}-By^{M})+(\nu^{M})^{T}y^{M}=0 $.
上述定理3.2表明, 存在有限的常数$ M_{1}\in R_{+} $, 使得当罚因子$ M\geq M_{1} $时, 问题(2.5) 的最优解满足问题(2.3) 的下层问题的最优性条件, 同时由罚问题目标函数的单调不增性可知, 通过求解问题(2.5) 可以得到问题(2.3) 的最优解. 事实上, 有如下结果.
定理3.3 假设条件$ (A) $满足, 且$ \{(x^{M}, y^{M}, \lambda^{M}, \mu^{M}, \nu^{M})\} $为问题(2.5) 相应于罚因子$ M\in R_{+} $的最优解序列, 那么存在$ M_{1}\in R_{+} $, 使得当$ M\geq M_{1} $时, $ (x^{M}, y^{M}, \lambda^{M}) $为问题(2.3) 的最优解.
证 由上述定理3.2, 定理3.3显然成立.
定理3.3表明, 对所考虑的非线性半向量二层规划问题(1.2), 本文所构造的罚函数是精确的. 下面给出问题(2.5) 的解的最优性判别结果.
定理3.4 假设条件$ (A) $满足, $ (\lambda, \mu, \nu), (\lambda', \mu', \nu')\in W $, 且$ (x^{M}, y^{M}) $为问题
相应于罚因子$ M\in R_{+} $的最优解. 则有,
证 由于$ (x^{M}, y^{M}) $为问题$ Q_{M}(\lambda', \mu', \nu') $的最优解, 则有
又由于
可得
整理可得
注. 令$ \alpha(\lambda', \mu', \nu')=\min\limits_{(\lambda, \mu, \nu)\in W}(\mu-\mu')^{T}(b-Ax^{M}-By^{M})+(\nu-\nu')^{T}y^{M} $. 由上述定理3.4可知, 如果$ \alpha(\lambda', \mu', \nu')<0 $, 那么就有$ (\lambda', \mu', \nu')\notin \mbox{argmax}\{Q_{M}(\lambda, \mu, \nu):(\lambda, \mu, \nu)\in W\}. $这也为下面的算法设计奠定了基础.
由上述定理3.4及注解, 可以设计如下求解非线性半向量二层规划问题(1.2) 的算法. 该算法通过求解一系列光滑非线性规划问题得到原非线性半向量二层规划问题的最优解.
算法:
步0 选取初始罚因子$ M>0 $, $ (\lambda^{0}, \mu^{0}, \nu^{0})\in W $, $ i=0 $.
步1 求解$ \max\limits_{(x, y)\in Z}F(x, y)-M[(\mu^{i})^{T}(b-Ax-By)+(\nu^{i})^{T}y] $, 得到最优解$ (x^{i}, y^{i}) $.
步2 求解$ \min\limits_{(\lambda, \mu, \nu)\in W}(\mu-\mu^{i})^{T}(b-Ax^{i}-By^{i})+(\nu-\nu^{i})^{T}y^{i} $, 得到最优解$ (\lambda^{*}, \mu^{*}, \nu^{*}) $以及目标函数值$ \alpha(\lambda^{i}, \mu^{i}, \nu^{i}) $.
步3
(1) 如果$ \alpha(\lambda^{i}, \mu^{i}, \nu^{i})<0 $, 令$ (\lambda^{i+1}, \mu^{i+1}, \nu^{i+1})=(\lambda^{*}, \mu^{*}, \nu^{*}) $, $ i=i+1 $, 转步1.
(2) 如果$ \alpha(\lambda^{i}, \mu^{i}, \nu^{i})\geq 0 $, 且$ (\mu^{i})^{T}(b-Ax^{i}-By^{i})+(\nu^{i})^{T}y^{i}>0 $, 令$ M=5M $, 转步1.
(3) 如果$ \alpha(\lambda^{i}, \mu^{i}, \nu^{i})\geq 0 $, 且$ (\mu^{i})^{T}(b-Ax^{i}-By^{i})+(\nu^{i})^{T}y^{i}=0 $, 那么非线性半向量二层规划问题的最优解为$ (x^{*}, y^{*})=(x^{i}, y^{i}) $.
在上述算法步3中, (2) 和(3) 主要判断问题(2.3) 的下层问题的互补约束条件是否成立. 如果不成立, 则将罚因子增大; 如果满足, 则可得到原非线性半向量二层规划问题的最优解.
为了说明算法实现过程以及检验其可行性, 考虑如下非线性半向量二层规划问题.
在上述非线性半向量二层规划问题(4.1) 中, 下层问题的两个目标函数是一致的, 因此其最优解与文献[14]中的最优解相同, 即最优解$ (x^{*}, y^{*})=(11.14, 8.86) $. 下面采用上述算法对问题(4.1) 进行求解.
首先基于问题(4.1) 的下层问题的标量化方法以及最优性条件, 将其转化为上述问题(2.5) 的形式, 可以得到
其中, $ \lambda $为下层目标函数的权重系数, $ (\mu_{1}, \mu_{2}, \nu) $为下层问题的Lagrange乘子.
具体的求解过程如下:
步0 选取初始罚因子$ M=200 $, 初始点$ (\lambda^{0}, \mu^{0}, \nu^{0})=(1, 1, 0, 0) $, $ i=0 $.
步1 求解如下优化问题,
得到最优解$ (x^{0}, y^{0})=(11.14, 8.86) $.
步2 求解如下优化问题,
得到最优解$ (\lambda^{*}, \mu_{1}^{*}, \mu_{2}^{*}, \nu^{*})=(1, 1, 0, 0) $.
步3 由于$ \alpha(\lambda^{0}, \mu^{0}, \nu^{0})=0 $, 且$ \mu_{1}^{0}(20-x^{0}-y^{0})+\mu_{2}^{0}(10-y^{0})+v^{0}y^{0}=0 $. 故原问题的最优解为$ (x^{*}, y^{*})=(x^{0}, y^{0})=(11.14, 8.86) $.
显然, 对于上述非线性半向量二层规划问题(4.1), 本文所得到的最优解与文献[14]中的最优解是一致的, 这也表明上述算法对该类非线性半向量二层规划问题是可行性的.
本文研究了非线性-线性半向量二层规划问题的罚函数求解方法. 基于下层问题的加权标量化方法和最优性条件, 得到了含互补约束的非线性规划问题; 同时取互补约束为罚项, 构造了相应的罚问题. 针对罚问题约束函数的变量可分离性, 得到了罚问题最优解的相关性质以及最优性条件, 进而设计了相应的罚函数算法. 数值算例表明, 本文所设计的算法对该类非线性半向量二层规划问题是可行的.
值得指出的是, 本文所设计的罚函数算法只需要通过求解一系列光滑非线性规划问题, 就可以得到原非线性半向量二层规划问题的最优解, 因此具有较好的应用前景.