本文考虑下述非线性规划问题:
其中, 函数$ f(x) $, $ g_1, \ldots, g_p $, $ h_1, \ldots, h_q $, $ G_1, \ldots, G_l $, $ H_1, \ldots, H_l $: $ \mathbb{R}^n\rightarrow \mathbb{R} $均连续可微.在问题(1.1)任意可行点$ x $处, 对任意固定的$ t $, $ G_t(x) $和$ H_t(x) $至少有一个为零, 即两个函数的乘积为零, 我们称这样的等式约束为存零约束, 问题(1.1)则为“存零约束“优化问题, 简记为MPSC.该模型首先由Mehlitz[1]提出并系统研究.文献[1]指出, 最优控制问题的离散化、Either-or约束优化、0-1规划等问题均可以转化为问题(1.1), 因此有必要讨论问题(1.1)的相关理论.由于常用的约束规范比如线性独立约束规范(LICQ)、Mangasarian-Fromovitz约束规范(MFCQ)在问题(1.1)的可行点处均不满足, 因此不能将其看作一般的非线性规划处理.
MPSC的约束结构与具有互补约束、消失约束的优化问题密切相关, 见文献[2].Mehlitz[1]给出了一些平稳性概念, 如弱平稳性, Mordukhovich(M-)平稳性和强(S-)平稳性, 然后提出了MPSC特定的约束规范, 例如MPSC Mangasarian-Fromovitz约束规范(MPSC-MFCQ), MP-SC线性独立约束规范(MPSC-LICQ), MPSC Abadie约束规范和MPSC Guignard约束规范.Yang等人[3]得出了满足增广拉格朗日问题二阶必要最优性条件的点序列的极限点是原互补约束优化问题的的强平稳点.Singh等人[4]针对均衡约束多目标优化问题建立了Wolfe型对偶和Mond-Weir型对偶模型, 并在伪凸性和拟凸性假设下建立了弱对偶和强对偶定理.
对偶性在研究优化问题时非常重要.经典的Wolfe对偶是由学者Wolfe于1961年引入.目前, 研究问题的对偶模型已经被用作解决各种优化问题的工具, 如半无限规划问题[5], 变分不等式问题[6], 分数式编程问题[7], 凸优化问题[8]等.陈世国[9]对不可微多目标规划在伪不变凸和拟不变凸时给出了弱有效解和有效解的Mond-Weir型对偶理论.之后, 陈世国等人[10]针对含有锥约束的多目标变分问题, 得到其广义对称对偶性.Mishra[11]在一些假设下, 建立了消失约束优化问题与对偶问题之间的弱、强、逆、限制逆和严格逆对偶性结果.本文基于文献[11], 拟研究MPSC的Wolfe型对偶问题.
本文余下组成部分为: 第2节给出本文研究所需的基本定义.第3节提出Wolfe型对偶模型, 在凸性和严格凸性假设下, 获得原问题的Wolfe对偶问题的弱、强、逆、限制逆和严格逆对偶结果.
为便于后续研究, 定义指标集:
其中, $ \{\mathcal{I}_G, \mathcal{I}_H, \mathcal{I}_{GH}\} $是$ \{1, \ldots, l\} $上互不相交的划分.定义MPSC的拉格朗日函数为
下面将给出一些关于MPSC的平稳性和约束规范的定义.
定义2.1[1] 设$ x\in\mathbb{R}^n $为MPSC的可行点, 如果存在乘子满足
则称$ x $为Mordukhovich平稳点, 简记为M平稳点.
定义2.2[1] 设$ x\in\mathbb{R}^n $为MPSC的可行点, 如果在$ x $点处约束函数的梯度
线性独立, 则称MPSC-LICQ在$ x $点处成立.
在建立对偶理论时, 凸性和广义凸性概念具有重要作用, 因此, 给出定义如下:
定义2.3[12] 设$ S\subseteq\mathbb{R}^n $为任一非空集合, $ f:\mathbb{R}^n\rightarrow \mathbb{R} $连续可微.则称$ f $在$ x^*\in S $点处是凸的, 当且仅当对于任意的$ x\in S $, 有
若$ x\neq x^* $时, 以上定义的严格不等式成立, 则称$ f $在$ x^*\in S $点处是严格凸的.
定义2.4[12] 设$ S\subseteq\mathbb{R}^n $为任一非空集合, $ f:\mathbb{R}^n\rightarrow \mathbb{R} $连续可微.则称$ f $在$ x^*\in S $点处是拟凸的, 当且仅当对于任意的$ x\in S $, 有
定义2.5[12] 设$ S\subseteq\mathbb{R}^n $为任一非空集合, $ f:\mathbb{R}^n\rightarrow \mathbb{R} $连续可微.则称$ f $在$ x^*\in S $点处是伪凸的, 当且仅当对于任意的$ x\in S $, 有
定义2.6[12] 设$ S\subseteq\mathbb{R}^n $为任一非空集合, $ f:\mathbb{R}^n\rightarrow \mathbb{R} $连续可微.则称$ f $在$ x^*\in S $点处是严格伪凸的, 当且仅当对于任意的$ x\in S $且$ x\neq x^* $, 有
本节根据可行点$ x\in X $定义MPSC的Wolfe型对偶问题(WD)如下:
定义WD($ x $)所有可行点构成的集合为
此时, 定义集合$ \Omega(x) $在$ \mathbb{R}^n $上的投影如下
为区分MPSC与WD, 本节考虑由WD定义的另一个对偶问题
其中定义$ \Omega=\cap_{x\in X}\Omega(x) $是WD所有可行点的集合, $ P\Omega $是集合$ \Omega $在$ \mathbb{R}^n $上的投影.为方便起见, 定义以下指标集:
定理3.1(弱对偶) 设$ x\in X, (y, \lambda_\iota, \lambda_e, \mu, \nu)\in\Omega $.如果下列条件中有一个成立:
(ⅰ) $ L(\cdot, \lambda_\iota, \lambda_e, \mu, \nu) $在$ y\in X\cup P\Omega $处为凸.
(ⅱ) $ f, -g_i(i\in\mathcal{I}^+_g), h_j(j\in\mathcal{I}^+_h), -h_j(j\in\mathcal{I}^-_h), G_t(t\in\mathcal{I}^+_G), -G_t(t\in\mathcal{I}^-_G), H_t(t\in\mathcal{I}^+_H), -H_t(t\in\mathcal{I}^-_H) $在$ y\in X\cup P\Omega $处为凸.
则$ f(x)\geq L(y, \lambda_\iota, \lambda_e, \mu, \nu). $
证 (ⅰ) 反证法.假设
因为$ x $和$ (y, \lambda_\iota, \lambda_e, \mu, \nu) $分别为MPSC和WD的可行点, 显然有
则有
将(3.2)和(3.3)相加, 有
即是
根据$ L(\cdot, \lambda_\iota, \lambda_e, \mu, \nu) $的凸性可得
由于$ (y, \lambda_\iota, \lambda_e, \mu, \nu) $是WD的可行点, 即$ \nabla L(y, \lambda_\iota, \lambda_e, \mu, \nu)=0 $, 则(3.5)可化简为$ L(y, \lambda_\iota, \lambda_e, \mu, \nu) $ $ <L(x, \lambda_\iota, \lambda_e, \mu, \nu) $.这与(3.4)矛盾, 因此结论得证.
(ⅱ) 根据定理中的第二个题设条件, 易得$ L(\cdot, \lambda_\iota, \lambda_e, \mu, \nu) $在$ y\in X\cup P\Omega $处为凸, 再结合(ⅰ)的证明, 即可得证.
定理3.2 (强对偶) 令$ x^*\in X $是MPSC的局部最小解, MPSC-LICQ在$ x^* $处成立.则存在拉格朗日乘子$ (\lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*) $使得$ (x^*, \lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*) $是WD的可行点, 且
另外, 如果下列条件中有一个成立:
(ⅰ) $ L(\cdot, \lambda_e, \lambda_\iota, \mu, \nu) $在$ y\in X\cup P\Omega $处为凸.
(ⅱ) $ f, -g_i(i\in\mathcal{I}^+_g(x^*)), h_j(j\in\mathcal{I}^+_h(x^*)), -h_j(j\in\mathcal{I}^-_h(x^*)), G_t(t\in\mathcal{I}^+_G(x^*)), -G_t(t\in\mathcal{I}^-_G(x^*)), H_t(t\in\mathcal{I}^+_H(x^*)), -H_t(t\in\mathcal{I}^-_H(x^*)) $在$ y\in X\cup P\Omega $处为凸.
则, $ (x^*, \lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*) $是WD的全局最大解且$ f(x^*)=L(x^*, \lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*). $
证 由于$ x^* $是MPSC的局部最小解且MPSC-LICQ在该点处成立, 再根据定义2.1, 对于点$ x^* $, 存在拉格朗日乘子$ (\lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*) $使得(2.1) 成立, 因此$ (x^*, \lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*) $是WD的可行点.再根据(2.1)的后四个条件和(3.1)易得(3.6).由定理3.1, 有
进一步将(3.6)与(3.7)相加有$ L(x^*, \lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*)\geq L(y, \lambda_\iota, \lambda_e, \mu, \nu), \forall(y, \lambda_\iota, \lambda_e, \mu, \nu)\in\Omega(x^*). $即是$ (x^*, \lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*) $为WD的全局最大解.同时, MPSC的局部最优值等价于WD的全局最优值.
定理3.3 (逆对偶) 令$ x $是MPSC的非空可行集, $ (y^*, \lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*) $是WD的可行点并有以下成立
(ⅰ) $ L(\cdot, \lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*) $在$ y^*\in X\cup P\Omega $处为凸.
(ⅱ) $ f, -g_i(i\in\mathcal{I}^+_g), h_j(j\in\mathcal{I}^+_h), -h_j(j\in\mathcal{I}^-_h), G_t(t\in\mathcal{ I}^+_G), -G_t(t\in\mathcal{I}^-_G), H_t(t\in\mathcal{I}^+_H), -H_t(t\in\mathcal{I}^-_H) $在$ y^*\in X\cup P\Omega $处为凸. 则$ y^* $为MPSC的全局最小解.
证 反证法.假设$ y^* $不是MPSC的全局最小解, 即存在$ \widehat{x}\in X $使得
(ⅰ)因为$ \widehat{x} $和$ (y^*, \lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*) $分别为MPSC和WD的可行点, 由定理中的假设易得
进一步推得
将(3.9)和(3.10)相加有$ L(\widehat{x}, \lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*)<L(y^*, \lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*). $根据$ L(\cdot, \lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*) $在$ y\in X\cup P\Omega $处为凸, 可得
这与约束$ \nabla L(y^*, \lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*)=0 $矛盾, 因此结论得证.
(ⅱ)根据定理中的第二个题设条件, 易得$ L(\cdot, \lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*) $在$ y^*\in X\cup P\Omega $处为凸, 再结合(ⅰ)的证明, 即可得证.
定理3.4(限制逆对偶) 令$ x^*\in X $是MPSC的任一可行点, $ (y^*, \lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*) $是WD的可行点且满足$ f(x^*)=L(y^*, \lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*) $另外, 如果下列条件中有一个成立:
(ⅱ) $ f, -g_i(i\in\mathcal{I}^+_g(x^*)), h_j(j\in\mathcal{I}^+_h(x^*)), -h_j(j\in\mathcal{I}^-_h(x^*)), G_t(t\in\mathcal{ I}^+_G(x^*)), -G_t(t\in\mathcal{I}^-_G(x^*)), H_t(t\in\mathcal{I}^+_H(x^*)), -H_t(t\in\mathcal{I}^-_H(x^*)) $在$ y^*\in X\cup P\Omega $处为凸.
则$ x^* $为MPSC的全局最小解.
证 反之, 假设$ x^* $不是MPSC的全局最小解, 则存在$ \widehat{x} $使得$ f(\widehat{x})<f(x^*) $.结合定理中的假设有$ f(\widehat{x})<L(y^*, \lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*), $这与定理3.1的结论矛盾, 因此得证定理3.4.
定理3.5 (严格逆对偶) 令$ x^*\in X $是MPSC的局部最小解, 并使得MPSC-LICQ在该点处成立.此外, 假设定理3.2的假设条件成立, $ (y^*, \lambda^*_e, \lambda^*_\iota, \mu^*, \nu^*) $是WD的全局最大解. 如果下列条件中有一个成立:
(ⅰ) $ L(\cdot, \lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*) $在$ y^*\in X\cup P\Omega $处为严格凸.
(ⅱ) $ f $是严格凸的, 且$ -g_i(i\in\mathcal{I}^+_g(x^*)), h_j(j\in\mathcal{I}^+_h(x^*)), -h_j(j\in\mathcal{I}^-_h(x^*)), G_t(t\in\mathcal{I}^+_G(x^*)) $, $ -G_t(t\in\mathcal{I}^-_G(x^*)), H_t(t\in\mathcal{I}^+_H(x^*)), -H_t(t\in\mathcal{I}^-_H(x^*)) $在$ y^*\in X\cup P\Omega $处为凸. 则$ x^*=y^* $.
证 (ⅰ) 同样用反证法.假设$ x^*\neq y^* $.则由定理3.2, 存在拉格朗日乘子$ (\overline{\lambda}_\iota, \overline{\lambda}_e, \overline{\mu}, \overline{\nu}) $使得$ (x^*, \overline{\lambda}_\iota, \overline{\lambda}_e, \overline{\mu}, \overline{\nu}) $为WD的全局最大解, 因此
根据$ x^* $和$ (y^*, \lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*) $分别是MPSC和WD的可行点, 容易得到
从而有
将(3.11)与(3.12)相加有
结合以上不等式以及$ L(\cdot, \lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*) $在$ y^*\in X\cup P\Omega $处为严格凸, 推知
(ⅱ)根据定理中的第二个题设条件, 易得$ L(\cdot, \lambda^*_\iota, \lambda^*_e, \mu^*, \nu^*) $在$ y^*\in X\cup P\Omega $处为严格凸, 再结合(ⅰ)的证明, 即可得证.
接下来, 利用下面的例子来验证Wolfe型对偶和相关定理的有效性.
例3.1 考虑含存零约束的优化问题
其可行点的集合X为
(3.13)的对偶形式为
(1) 令$ x^*=(1, -3, 0)^{\rm T}\in X, (y^*_1, y^*_2, y^*_3, \mu^*_1, \nu^*_1)=(1, -3, 0, 0, 0)\in\Omega(x^*) $, 有
易验证定理3.4的所有条件均成立, 因此$ x^* $为(3.13)的全局最小解.故定理3.4得以验证.
(2) 由(3.14)的前三个等式约束可得, 当$ y_1=1, y_2=-3, y_3=\sqrt[5]{\frac{\nu_1-\mu_1}{6}} $.结合(3.13)中的目标函数, 易得到
当$ \mu_1=-1, y_1\in\mathbb{R}, \nu_1=-1, y_2\in\mathbb{R}, y_3=0 $时, 同样可得到
当$ \mu_1=-1, y_1\in\mathbb{R}, y_2=-3, y_3=\sqrt[5]{\frac{\nu_1+1}{6}} $时,
当$ \nu_1=-3, y_2\in\mathbb{R}, y_1=1, y_3=\sqrt[5]{\frac{-\mu_1-1}{6}} $时,
综上所述, 定理3.1得以验证.
(3) 因为$ \nabla H_1(x)=(0, 2x_2+6, -1)^{\rm T} $和$ \nabla G_1(x)=(2x_1-2, 0, 1)^{\rm T} $, 即(3.13)满足MPSC-LICQ.由定义2.1, 对于点$ x^*=(1, -3, 0)^{\rm T}, y^*=(1, -3, 0)^{\rm T} $, 存在拉格朗日乘子$ (\mu^*_1, \nu^*_1)=(0, 0) $使得$ (y^*, \mu^*_1, \nu^*_1) $为(3.14)的可行点且有
因此, $ (y^*, \mu^*_1, \nu^*_1) $为(3.14)的全局最大解, 同时有$ f(x^*)=L(y^*, \mu^*_1, \nu^*_1) $.定理3.2得证.
上述考虑的均是在凸性条件下的对偶刻画, 如果弱化凸性假设, 则一方面, 在证明弱、强和逆对偶性时, 利用拟凸或伪凸性无法根据定义推出矛盾, 进而也无法证得限制逆和严格逆对偶性成立; 另一方面, 为获得上述结论, 可以通过刻画比原Wolfe型对偶约束条件更加严格的Mond-Weir型对偶问题得到.由于篇幅受限, 本文只针对存零约束优化问题建立了Wolfe型对偶问题, 并分析了对偶问题分别在凸性、严格凸性的假设下, 原问题的对偶问题的弱、强、逆、限制逆和严格逆对偶结果, 并给出例子验证结论成立.