数学杂志  2019, Vol. 39 Issue (2): 216-226   PDF    
扩展功能
加入收藏夹
复制引文信息
加入引用管理器
Email Alert
RSS
本文作者相关文章
李春丽
BSDE在跳框架下的风险敏感控制问题中的应用
李春丽    
1. 冶金工业过程系统科学湖北省重点实验室(武汉科技大学), 湖北 武汉 430081;
2. 武汉科技大学理学院, 湖北 武汉 430065
摘要:本文研究了由带跳的随机微分方程驱动的风险敏感控制问题.利用测度变换和带跳的二次增长的倒向随机微分方程,证明了此问题最优控制的存在性,并通过相应倒向随机微分方程解的初值给出了此问题的值函数.
关键词风险敏感控制    带跳的随机微分方程    测度变换    带跳的二次增长的倒向随机微分方程    
THE APPLICATION OF BSDE IN RISK SENSITIVE CONTROL PROBLEM UNDER THE FRAMEWORK WITH JUMP
LI Chun-li    
1. Hubei Province Key Laboratory of Systems Science in Metallurgical Process(Wuhan University of Science and Technology), Wuhan 430081, China;
2. School of Science, Wuhan University of Science and Technology, Wuhan 430065, China
Abstract: In this paper, we deal with the risk sensitive control problem driven by stochastic differential equation with jump. By using the transformation of measure and backward stochastic differential equation with jump and quadratic growth, we prove that the optimal feedback control exists, and the value function for this problem is given by the initial value of the solution of the related BSDE.
Keywords: risk sensitive control     stochastic differential equation with jump     the transformation of measure     backward stochastic differential equation with jump and quadratic growth    
1 引言和预备知识

风险敏感控制是随机最优控制问题的一个重要研究主题. 1990年左右, Whittle[1]提出风险敏感控制准则, 用以解决最优风险投资问题.此准则既体现了投资者对随机资产的关注, 也通过一个风险敏感参数$ \theta $ ($ \theta\in \mathbb{R}\setminus\{0\} $)体现了投资者对承担风险的态度.下面简单介绍一下风险敏感控制问题.设$ h = (h_t)_{0\leq t\leq T} $是时间段$ [0, T] $上的某控制过程, $ X^h = \{X_t^h, t\in[0, T]\} $是某可控随机系统, $ \mathcal{J} $是与$ X_t^h $联系的某种随机准则, $ \mathcal{J} $的常见形式为

$ \mathcal{J} = \int_0^T L(s, X_s^h, h_s)ds+g(X^h_T), $

其中$ L $称为运行费用函数, $ g $称为终值费用函数.所谓的风险敏感控制问题, 即指在可行性控制集$ \mathcal{H} $中选择一个最优策略$ h $, 使得下面的效用函数达到最小: $ J(x, h;\theta) = \frac{1}{\theta }\log \mathbb{E}e^{\theta \mathcal{J}}, $相应的最小值$ u(x, \theta) $称为值函数, 即$ u(x, \theta) = \inf\limits_{h\in\mathcal{H}}J(x, h;\theta), $若存在可行性控制$ h = {\hat{h}} $, 使得$ u(x, \theta) = J(x, {\hat{h}};\theta) $, 则称$ {\hat{h}} $为最优控制.

自Whittle提出风险敏感控制准则之后, 此准则被广泛应用于金融问题中.如Bielecki等[2]和Fleming等[3]分别在此准则下考虑了不同市场模型中的风险敏感投资管理问题.进一步, Kuroda和Nagai[4]考虑了因子市场模型中的遍历风险敏感控制问题; 作为连续框架下风险敏感控制问题的推广, Davis和Lleo[5-6]考虑了跳扩散市场模型中的风险敏感控制问题.此外, 还有很多关于这方面的工作, 这里就不一一赘述了.

众所周知, 研究最优控制问题的一个经典方法就是Bellman[7]提出的动态规划方法.此方法依赖于某二阶非线性偏微分方程, 称之为Hamiltion-Jacobi-Bellman (简称HJB)方程.研究最优控制问题的另外一个有效工具就是倒向随机微分方程(简称BSDE).线性BSDE最初由Bismu[8]作为随机Pontryagin最大值原理的伴随方程引入, 后来Panrdoux和Peng[9]研究了一般非线性BSDE.由于倒向随机微分方程与非线性偏微分方程的密切联系, 其被广泛应用到随机控制和数理金融中(可参考文献[9-10]等), 并逐步成为了金融领域的一个活跃分支.虽然BSDE方法在控制问题中应用广泛, 但因为风险敏感控制问题涉及到二次增长的BSDE, 故目前只有少量的工作用其来研究连续框架下的风险敏感控制问题, 此方面的工作可以参考文献[11].

本文尝试以BSDE为工具来考虑由带跳的随机微分方程驱动的风险敏感控制问题.目前考虑跳框架下风险敏感问题的文献较少, 比较有代表性的是前面提到的Davis和Lleo的工作, 他们以HJB方程为工具研究了跳扩散因子模型中的风险敏感最优投资组合问题.本文的新意在于以带跳的二次增长的BSDE为工具来研究跳框架下的风险敏感控制问题.关于二次增长的BSDE的结果主要在连续框架下, 具体可参见Kobylanski[12]和Hu等[13-15]工作.在跳框架下, Morlais[16]得到了一类特殊的二次增长的BSDE解的存在唯一性, 并以此为工具研究了金融市场中的最优投资组合问题.本文将利用文献[16]中的结果来得到相应于跳框架下风险敏感控制问题的BSDE解的存在唯一性, 并进一步研究跳框架下的风险敏感控制问题.

首先介绍一些与带跳的BSDE有关的预备知识.

$ (\Omega, \mathcal{F}, \mathbb{P}) $是一完备概率空间.在测度$ \mathbb{P} $下, $ W $是定义在$ \Omega\times [0, T] $上的实值标准Brown运动; $ p $是定义在$ \Omega\times [0, T]\times\mathbb{R}_* $ ($ \mathbb{R}_* = \mathbb{R}\setminus\{0\}) $上的实值Possion点过程, 记$ N_p(ds, de) $为相应的Poisson随机测度, $ v $$ N_p $的Lévy测度, $ \tilde{N}_p(ds, de) = N_p(ds, de)-v(de)ds $$ N_p $的补偿(具体概念参见文献[17]的第2章).假设$ W $$ p $相互独立.在$ (\Omega, \mathcal{F}, \mathbb{P}) $上配备如下滤子

$ \mathcal{F}_t = \sigma\Big(N_{p}([0, s]\times A), A\in\mathcal{B}(\mathbb{R}_*), s\leq t\Big) \vee\sigma(W_s, s\leq t)\vee \mathcal{N}, $

其中$ \mathcal{N} $表示$ \mathbb{P} $ -零集全体, $ \mathcal{B}(\mathbb{R}_*) $表示$ \mathbb{R}_* $上的Borel $ \sigma $ -代数.设$ \mathbb{H}\subset \mathbb{R} $是一个非空闭子集, 控制$ h $是一个取值于$ \mathbb{H} $$ \mathcal{F}_t $ -适应过程, 可控随机系统$ X^h = \{X^h_t, 0\leq t\leq T\} $满足下面带跳的随机微分方程

$ \begin{align} \begin{cases} &dX^h_t = b(t, X^h_t)dt+\sigma(t, X^h_t)[dW_t+R(t, X^h_t, h_t)dt]+ \int_{\mathbb{R}_*}\mu(t, X^h_{t^{-}}, e) \tilde{N}_p(dt, de), \\ &X^h_0 = x\in \mathbb{R}. \end{cases} \end{align} $ (1.1)

以下都假设$ N_p $的Lévy测度$ v(de) $有限且正, 并满足

$ \begin{equation} \nonumber v(\{0\}) = 0, \quad v\big((1\wedge|e|)^2\big): = \int_{\mathbb{R}_*}(1\wedge|e|)^2v(de)<\infty. \end{equation} $

下面介绍几个空间

$ \begin{aligned} &\mathcal{S}^{\infty}(\mathbb{R}): = \left\{\mbox{右连左极适应过程}Y:|Y|_{\mathcal{S}^\infty(\mathbb{R})} = {\rm esssup}_{\omega\in \Omega, t\in[0 T]}|Y_t(\omega)|<\infty\right\};\\ &L^2(W): = \left\{\mbox{可料过程}Z: \mathbb{E}\left( \int_0^T|Z_s|^2ds\right)<\infty\right\};\\ &L^2(\tilde{N}_{p}): = \left\{\mathbb{U}\otimes\mathcal{B}\:(\mathbb{R}_*)\mbox{可测过程}U_s(e): \mathbb{E}\left( \int_0^T \int_{\mathbb{R}_*}|U_s(e)|^2v(de)ds\right)<\infty\right\}, \end{aligned} $

其中$ \mathbb{U} $为集$ [0, T]\times \Omega $上所有可料集构成的$ \sigma $ -域.记$ L^0(v) $为从$ \mathbb{R}_* $映射到$ \mathbb{R} $的可测函数集(即文献[18]中的$ L^0(v, \mathbb{R}, \mathbb{R}_*) $).定义

$ \begin{aligned} &L^2(v): = \left\{u:u\in L^0(v), \mathbb{E}\left( \int_{\mathbb{R}_*}|u(e)|^2v(de)\right)<\infty\right\}, \\ &L^\infty(v): = \left\{u:u\in L^0(v), |u|_{L^\infty(v)} = \sup\limits_{e\in\mathbb{R}_*}|u(e)|<\infty\right\}. \end{aligned} $

考虑BSDE:

$ \begin{equation} Y_t = \xi+ \int_t^T f(s, Z_s, U_s)ds- \int_t^T Z_sdW_s- \int_t^T \int_{\mathbb{R}_*}U_s(e)\tilde{N}_{p}(ds, de), \end{equation} $ (1.2)

其中$ \xi $$ \mathcal{F}_T $ -可测实值随机变量, 生成元$ f(s, z, u):\Omega\times [0, T]\times\mathbb{R}\times L^2(v) $满足下面的假设.

假设 1.1  设$ C $是一个给定常数,

(i) 对任意$ z\in\mathbb{R} $, $ u\in (L^2\cap L^\infty)(v) $$ s\in[0, T] $,

$ -C(1+|z|^2)\leq f(s, z, u)\leq C+\frac{\beta|z|^2}{2}+ \int_{\mathbb{R}_*} \frac{e^{\beta u}-\beta u-1}{\beta}v(de), \ \mathbb{P}\mbox{-a.s.}; $

(ii) 对任意$ z, z'\in\mathbb{R} $, $ u\in L^2(v) $$ s\in[0, T] $,

$ |f(s, z, u)-f(s, z', u)|\leq C(1+|z|+|z'|)|z-z'|, \ \mathbb{P}\mbox{-a.s.}; $

(iii) 对任意$ z\in\mathbb{R} $, $ u, u'\in (L^2\cap L^\infty)(v) $$ s\in[0, T] $,

$ f(s, z, u)-f(s, z, u')\leq \int_{\mathbb{R}_*}\gamma_s(u, u')(u(e)-u'(e))v(de), \ \mathbb{P}\mbox{-a.s.}, $

其中

$ \gamma_s(u, u'):\Omega\times [0, T]\times L^2(v) \times L^2(v) $

满足$ -1+\delta\leq \gamma_s(u, u')\leq K, $其中$ \delta $$ K $是仅依赖于$ |u|_{L^\infty(v)}, |u'|_{L^\infty(v)} $的正常数.

$ \bar{Y}_t = Y_t+Ct $, 则方程(1.2)可以写作

$ \bar{Y}_t = (\xi+CT)+ \int_t^T[f(s, Z_s, U_s)-C]ds- \int_t^T Z_sdW_s- \int_t^T \int_{\mathbb{R}_*}U_s(e)\tilde{N}_{p}(ds, de). $

$ f $满足假设1.1, 则$ f(s, Z_s, U_s)-C $满足文献[16]中的假设$ ({\rm H}_1) $$ ({\rm H}_2) $.根据$ Y $$ \bar{Y} $的关系和文献[16]的结果, 立即有下面的引理.

引理 1.2 [16] 若终值$ \xi $有界(即$ |\xi|_\infty = {\rm{esssup}}_{\omega\in \Omega}|\xi(\omega)|<\infty $), 生成元$ f $满足假设1.1, 则BSDE (2)存在唯一解$ (Y, Z, U)\in S^\infty(\mathbb{R})\times L^2(W)\times L^2(\tilde{N}_{p}) $, 且存在仅依赖于$ |\xi|_{\infty} $的常数$ C $, 使得

$ \begin{eqnarray*} &&|Y|_{S^{\infty}(\mathbb{R})}\leq C, \quad |U_s|_{L^{\infty}(v)}\leq C, \\ &&\mathbb{E}\left( \int_0^T|Z_s|^2ds+ \int_0^T \int_{\mathbb{R}_*}|U_s(e)|^2v(de)ds\right)\leq C. \end{eqnarray*} $
2 跳扩散驱动的风险敏感控制问题

下面考虑第1节中所提的风险敏感控制问题, 为了简化起见, 不失一般性, 取$ \theta = 1 $.

定义

$ \begin{equation} J(x, h) = \log\mathbb{E}\exp\left( \int_0^T L(s, X^h_s, h_s)ds+g(X^h_T)\right), \end{equation} $ (2.1)

其中$ X^h $满足方程(1.1).

下面考虑如下风险敏感控制问题:

$ \begin{align} u(x) = \inf\limits_{h\in\mathcal{H}}J(x, h), \end{align} $ (2.2)

其中可行性控制集$ \mathcal{H} $的定义见下文.

首先对(1.1)和(2.1)式中出现的函数作一些假设.

假设 2.1  (i)函数$ b:[0, T]\times \mathbb{R}\rightarrow\mathbb{R} $, $ \sigma:[0, T]\times\mathbb{R}\rightarrow\mathbb{R} $ Borel -可测, $ \mu:[0, T]\times\mathbb{R}\times\mathbb{R}_*\rightarrow\mathbb{R} $可料.

(ii) 存在常数$ C>0 $, 使得对任意$ t\in[0, T] $, $ x, y\in\mathbb{R} $,

$ \begin{eqnarray*} &&|b(t, x)-b(t, y)|^2+|\sigma(t, x)-\sigma(t, y)|^2+ \int_{\mathbb{R}_*}|\mu(t, x, e)-\mu(t, y, e)|^2v(de)\leq C|x-y|^2, \\ &&|\sigma(t, x)|^2+|b(t, x)|^2+ \int_{\mathbb{R}_*}|\mu(t, x, e)|^2v(de)\leq C(1+|x|^2). \end{eqnarray*} $

假设 2.2  (i)函数$ R:[0, T]\times\mathbb{R}\times\mathbb{H}\mapsto\mathbb{R} $ Borel可测, 且$ \forall\ t\in[0, T], x\in\mathbb{R} $, $ R(t, x, \cdot) $$ \mathbb{H} $$ \mathbb{R} $上的连续函数.

(ii) 存在常数$ C>0 $, 使得对任意$ t\in[0, T] $, $ x, y\in\mathbb{R} $, $ h\in\mathbb{H} $,

$ \begin{equation} |R(t, x, h)|\leq C(1+|h|), \quad |R(t, x, h)-R(t, y, h)|\leq C|x-y|(1+|h|). \end{equation} $ (2.3)

假设 2.3  (i)函数$ L:[0, T]\times\mathbb{R}\times\mathbb{H}\mapsto\mathbb{R} $$ g:\mathbb{R}\mapsto\mathbb{R} $ Borel -可测.且对任意$ t\in [0, T], x\in \mathbb{R} $, $ L(t, x, \cdot) $$ \mathbb{H} $$ \mathbb{R} $上的连续函数.

(ii) 存在常数$ C>0 $使得对任意$ t\in[0, T] $, $ x\in\mathbb{R} $$ h\in\mathbb{H} $, $ 0\leq L(t, x, h)\leq C(1+|h|^2). $

(iii) 存在正常数$ M $$ c $使得对任意$ t\in[0, T] $, $ x\in\mathbb{R} $$ h\in\mathbb{H} $, 若$ |h|>M $, 则$ L(t, x, h)\geq c|h|^2. $

(iv) 函数$ L(t, x, h) $$ g(x) $有界.

为解决问题(2.2), 首先考虑下面的跳扩散方程

$ \begin{equation} \begin{cases} &dX_t = b(t, X_t)dt+\sigma(t, X_t)dW_t+ \int_{\mathbb{R}_*}\mu(t, X_{t^{-}}, e) \tilde{N}_p(dt, de), \ t\in [0, T], \\ &X_0 = x, \end{cases} \end{equation} $ (2.4)

根据文献[17], 在假设2.1下, 存在唯一轨道右连左极的$ \mathcal{F}_t $ -适应过程$ X = \{X_t, t\in [0, T]\} $满足方程(2.4).

定义 2.4  称$ \mathcal{F}_t $ -适应过程$ h_t $为可行性控制, 若

$ \begin{equation} \mathbb{E}\exp\left( \int_0^T R(s, X_s, h_s)dW_s-\frac{1}{2} \int_0^T |R(s, X_s, h_s)|^2ds\right) = 1, \end{equation} $ (2.5)

可行性控制集记为$ \mathcal{H} $.

对任意$ h\in\mathcal{H} $, 记

$ M^h = \exp\left( \int_0^T R(s, X_s, h_s)dW_s-\frac{1}{2} \int_0^T |R(s, X_s, h_s)|^2ds\right). $

定义$ d\mathbb{P}^h = M^hd\mathbb{P} $, 则$ \mathbb{P}^h $是一个概率测度.由Girsanov定理, 过程

$ W_t^h = W_t- \int_0^t R(s, X_s, h_s)ds, 0\leq t\leq T $

是一个$ (\mathcal{F}_t, \mathbb{P}^h) $-Brown运动, 且在测度$ \mathbb{P}^h $下, $ X $满足

$ \begin{equation} \begin{cases} &dX_t = b(t, X_t)dt+\sigma(t, X_t)[dW^h_t+R(t, X_t, h_t)dt]+ \int_{\mathbb{R}_*}\mu(t, X_{t^{-}}, e) \tilde{N}_p(dt, de), \\ &X_0 = x. \end{cases} \end{equation} $ (2.6)

比较(1.1)和(2.6)式, 可见$ X^h $在测度$ \mathbb{P} $下与$ X $在测度$ \mathbb{P}^h $下有相同的分布, 故(2.1)式中定义的费用

$ J(x, h) = \log\mathbb{E}^h\exp\left( \int_0^T L(s, X_s, h_s)ds+g(X_T)\right). $

因此, 风险敏感控制问题(2.2)可以等价写为

$ \begin{equation} u(x) = \inf\limits_{h\in\mathcal{H}}J(x, h) = \inf\limits_{h\in\mathcal{H}} \log\mathbb{E}^h\exp\left( \int_0^T L(s, X_s, h_s)ds+g(X_T)\right), \end{equation} $ (9)

其中$ X $满足方程(8), $ \mathbb{E}^h $是在测度$ \mathbb{P}^h $下的期望.

3 从二次增长的BSDE到跳扩散驱动的风险敏感控制问题

问题(2.7)联系到下面生成元$ \psi $关于$ z $二次增长的BSDE:

$ \begin{equation} Y_t = g(X_T)+ \int_t^T\psi(s, X_s, Z_s, U_s)ds- \int_t^T Z_sdW_s- \int_t^T \int_{\mathbb{R}_*}U_s(e)\tilde{N}_p(ds, de), \end{equation} $ (3.1)

其中

$ \psi(s, x, z, u) = \inf\limits_{h\in\mathbb{H}}\left\{L(s, x, h)+zR(s, x, h)\right\}+\frac{|z|^2}{2}+ \int_{\mathbb{R}_*} \left(e^{u(e)}-u(e)-1\right)v(de). $

$ \begin{equation} \varphi(s, x, z) = \inf\limits_{h\in\mathbb{H}}\left\{L(s, x, h)+zR(s, x, h)\right\}. \end{equation} $ (3.2)

假设 3.1  对任意$ t\in [0, T], \ x\in \mathbb{R} $$ z\in \mathbb{R} $,

$ \Gamma(t, x, z) = \{h\in\mathbb{H}: L(t, x, h)+zR(t, x, h) = \varphi(t, x, z)\} $

是非空的.

由文献[19]中的引理6.3和(58)式, 立即可以得到下面两个引理.

引理 3.2  若假设2.2, 假设2.3和假设3.1成立.则映射$ \varphi $: $ [0, T]\times\mathbb{R}\times\mathbb{R}\mapsto\mathbb{R} $是Borel可测函数, 且存在常数$ C>0 $使得

$ \begin{equation} \nonumber -C(1+|z|^2)\leq \varphi(t, x, z)\leq L(t, x, h)+C|z|(1+|h|). \end{equation} $

此外, (3.2)式中的下确界在半径为$ C(1+|z|) $的球中达到, 即

$ \begin{equation} \varphi(t, x, z) = \inf\limits_{h\in\mathbb{H}, |h|\leq C(1+|z|)}\left\{L(s, x, h)+zR(s, x, h)\right\} , t\in [0, T], x, z\in\mathbb{R}, \end{equation} $ (3.3)

$ \varphi(t, x, z)<L(s, x, h)+zR(s, x, h), \ \mbox{若}|h|>C(1+|z|). $

引理 3.3  在引理3.2的条件下, 存在Borel可测函数$ \gamma:[0, T]\times \mathbb{R}\times \mathbb{R} \mapsto \mathbb{R} $, 使得

$ \begin{equation} \varphi(t, x, z) = L(t, x, \gamma(t, x, z))+zR(t, x, \gamma(t, x, z)). \end{equation} $ (3.4)

此外, 存在常数$ C>0 $使得

$ \begin{equation} |\gamma(t, x, z)|\leq C(1+|z|). \end{equation} $ (3.5)

根据引理3.2, 引理3.3, 假设2.2及假设2.3, 立即可得存在正常数$ C, \beta $, 使得

$ \begin{equation} -C(1+|z|^2)\leq \varphi(t, x, z)\leq C+\frac{\beta|z|^2}{2}. \end{equation} $ (3.6)

另一方面, 既然(3.2)式中的下确界在半径为$ C(1+|z|) $的球中达到, 则对任意$ s\in [0, T] $, $ x, z, z'\in\mathbb{R} $, 当$ |z'|\leq |z| $时,

$ \inf\limits_{h\in\mathbb{H}, |h|\leq C(1+|z|)}\left\{L(s, x, h)+z'R(s, x, h)\right\} = \inf\limits_{h\in\mathbb{H}, |h|\leq C(1+|z'|)}\left\{L(s, x, h)+z'R(s, x, h)\right\}. $

因此, 根据引理3.2中的(3.3)式, 有

$ \begin{aligned} &|\varphi(s, x, z)-\varphi(s, x, z')|\\ = &\left|\inf\limits_{h\in\mathbb{H}, |h|\leq C(1+|z|)}\left\{L(s, x, h)+zR(s, x, h)\right\} -\inf\limits_{h\in\mathbb{H}, |h|\leq C(1+|z'|)}\left\{L(s, x, h)+z'R(s, x, h)\right\}\right|\\ \leq &\left|\inf\limits_{h\in\mathbb{H}, |h|\leq C(1+|z|)}\left\{L(s, x, h)+zR(s, x, h)\right\} -\inf\limits_{h\in\mathbb{H}, |h|\leq C(1+|z|)}\left\{L(s, x, h)+z'R(s, x, h)\right\}\right|\\ &+\left|\inf\limits_{h\in\mathbb{H}, |h|\leq C(1+|z|)}\left\{L(s, x, h)+z'R(s, x, h)\right\} -\inf\limits_{h\in\mathbb{H}, |h|\leq C(1+|z'|)}\left\{L(s, x, h)+z'R(s, x, h)\right\}\right|\\ = &\left|\inf\limits_{h\in\mathbb{H}, |h|\leq C(1+|z|)}\left\{L(s, x, h)+zR(s, x, h)\right\} -\inf\limits_{h\in\mathbb{H}, |h|\leq C(1+|z|)}\left\{L(s, x, h)+z'R(s, x, h)\right\}\right|\\ \leq& \sup\limits_{h\in\mathbb{H}, |h|\leq C(1+|z|)}|\left(L(s, x, h)+zR(s, x, h)\right)-\left(L(s, x, h)+z'R(s, x, h)\right)|\\ \leq& \sup\limits_{h\in\mathbb{H}, |h|\leq C(1+|z|)}\left\{|z-z'||R(s, x, h)|\right\} \leq |z-z'|\sup\limits_{h\in\mathbb{H}, |h|\leq C(1+|z|)}(1+|h|)\\ = &C|z-z'|(1+|z|). \end{aligned} $

类似可得, 当$ |z'|>|z| $时, $ |\varphi(s, x, z)-\varphi(s, x, z')|\leq C|z-z'|(1+|z'|). $即对任意$ s\in [0, T] $, $ x, z, z'\in\mathbb{R} $, 存在$ C>0 $, 使得

$ \begin{equation} |\varphi(s, x, z)-\varphi(s, x, z')|\leq C(1+|z|+|z'|)|z-z'|. \end{equation} $ (3.7)

$ f(s, z, u) = \psi(s, X_s, z, u), $其中

$ \psi(s, x, z, u) = \varphi(s, x, z)+\frac{|z|^2}{2}+ \int_{\mathbb{R}_*} \left(e^{u(e)}-u(e)-1\right)v(de). $

根据(3.6)和(3.7)式, $ f(s, z, u) = \psi(s, X_s, z, u) $满足假设1.1.由引理1.2, 有如下推论.

推论 3.4  BSDE (3.1)存在唯一解$ (Y, Z, U)\in S^\infty(\mathbb{R})\times L^2(W)\times L^2(\tilde{N}_{p}) $, 且存在常数$ C $ ($ C $仅依赖于$ g $的界), 使得对任意$ s\in [0, T] $,

$ |Y|_{S^{\infty}(\mathbb{R})}\leq C, \quad |U_s|_{L^{\infty}(v)}\leq C, \quad \mathbb{E}\left( \int_0^T|Z_s|^2ds+ \int_0^T \int_{\mathbb{R}_*}|U_s(e)|v(de)ds\right)\leq C. $

下述定理给出了一个良好的可行性控制, 后面会证明其正好是问题(2.7)的最优控制.

定理 3.5  若$ \gamma(t, x, z) $是引理3.3中得到的Borel可测函数, $ X $是方程(2.4)的解, $ (Y, Z, U)\in S^\infty(\mathbb{R})\times L^2(W)\times L^2(\tilde{N}_{p}) $是BSDE(3.1)的解, 则$ \hat{h}_t = \gamma(t, X_t, Z_t) $是一个可行性控制.

  既然$ (Y, Z, U) $是(3.1)式的解, 则有$ \mathbb{E} \int_0^T |Z_s|^2ds<+\infty. $根据(2.3)和(3.5)式可得

$ \begin{aligned} \mathbb{E} \int_0^T |R(s, X_s, {\hat{h}}_s)|^2ds \leq C\left(1+\mathbb{E} \int_0^T|\gamma(t, X_t, Z_t)|^2dt\right) \leq C\left(1+\mathbb{E} \int_0^T |Z_s|^2ds\right)<+\infty. \end{aligned} $

因此$ \mathbb{P} $-a.s.,

$ \begin{equation} \int_0^T |R(s, X_s, {\hat{h}}_s)|^2ds< +\infty. \end{equation} $ (3.8)

由此可定义

$ M_T = \exp\left( \int_0^T R(s, X_s, \hat{h}_s)dW_s-\frac{1}{2} \int_0^T|R(s, X_s, \hat{h}_s)|^2ds\right). $

由定义2.4中的(2.5)式, 为证定理结论成立, 往证$ \mathbb{E}M_T = 1 $.

定义停时

$ \tau_n = \inf\left\{t\in [0, T]: \int_0^t |R(s, X_s, \hat{h}_s)|^2ds>n\right\}, $

若等号右边是空集, 则取$ \tau_n = T $.根据(3.8)式, 对$ \mathbb{P} $-a.s. $ \omega\in \Omega $, 存在整数$ N(\omega) $, 使得当$ n\geq N(\omega) $时, $ \tau_n(\omega) = T $.固定$ h^0\in\mathbb{H} $, 对任意$ n $定义

$ \begin{eqnarray*} &&{\hat{h}}^n_t = \hat{h}_t{\bf{1}}_{t\leq\tau_n}+h^0{\bf{1}}_{t>\tau_n};\\ &&M^n_T = \exp\left( \int_0^T R(s, X_s, {\hat{h}}^n_s)dW_s-\frac{1}{2} \int_0^T |R(s, X_s, {\hat{h}}^n_s|^2ds\right);\\ &&W_t^n = W_t- \int_0^t R(s, X_s, {\hat{h}}^n_s)ds. \end{eqnarray*} $

对固定的$ n $, 由(2.3)式中的条件$ |R(t, x, h)|\leq C(1+|h|) $$ \tau_n $的定义易验证$ \int_0^T R(s, X_s, {\hat{h}}^n_s)dW_s $满足Novikov条件, 故$ \mathbb{E} M^n_T = 1 $.

$ d\mathbb{P}^n = M^n_Td\mathbb{P} $, 由Girsanov定理, $ W^n = \{W^n_t, 0\leq t \leq T\} $$ (\mathcal{F}_t, \mathbb{P}^n) $-Wiener过程.

既然$ (Y, Z, U) $满足下面的BSDE:

$ \begin{aligned} Y_t = &g(X_T)+ \int_t^T \left[\varphi(s, X_s, Z_s)+\frac{Z_s^2}{2}+ \int_{\mathbb{R}^*}\left(e^{U_s(e)}-U_s(e)-1\right)v(de)\right]ds\\ &- \int_t^T Z_sdW_s- \int_t^T \int_{\mathbb{R}^*}U_s(e)\tilde{N}_p(ds, de), \quad t\in [0, T]. \end{aligned} $

在测度$ \mathbb{P}^n $下, 上述BSDE可写为

$ \begin{aligned} Y_t = &g(X_T)+ \int_t^T\left[\varphi(s, X_s, Z_s)+\frac{Z_s^2}{2}-Z_sR(s, X_s, \hat{h}^n_s) + \int_{\mathbb{R}^*}\left(e^{U_s(e)}-U_s(e)-1\right)v(de)\right]ds\\ &- \int_t^T Z_sdW^n_s - \int_t^T \int_{\mathbb{R}^*}U_s(e)\tilde{N}_p(ds, de), \quad t\in [0, T]. \end{aligned} $

由Itô公式,

$ \begin{align} e^{Y_t} = &e^{Y_0}- \int_0^te^{Y_s}\left[\varphi(s, X_s, Z_s)-Z_sR(s, X_s, \hat{h}^n_s)\right]ds\\ &+ \int_0^t e^{Y_s}Z_sdW^n_s + \int_0^t \int_{\mathbb{R}^*}e^{Y_s}\left(e^{U_s(e)}-1\right)\tilde{N}_p(ds, de), \quad t\in [0, T]. \end{align} $ (3.9)

定义

$ \begin{align} \hat{Y}_t = e^{Y_t}\exp\left( \int_0^t \left[\varphi(s, X_s, Z_s)-Z_sR(s, X_s, \hat{h}^n_s)\right]ds \right), \quad t\in [0, T]. \end{align} $ (3.10)

先对(3.10)式用分部积分公式, 再将(3.9)式带入, 取时间区间为$ [0, \tau_n] $, 可得

$ \hat{Y}_{\tau_n} = \hat{Y}_0+ \int_0^{\tau_n} \hat{Y}_tZ_tdW^n_t+ \int_0^{\tau_n} \int_{\mathbb{R}^*} \hat{Y}_t\left(e^{U_t(e)}-1\right)\tilde{N}_p(dt, de). $

注意$ L(t, x, h) $$ Y $都有界, 由$ \hat{Y} $的定义知$ \hat{Y} $是有界过程, 又$ U $有界, 故上式后两项中的随机积分期望为0.因而$ \mathbb{E}^n\hat{Y}_{\tau_n} = \hat{Y}_0 = e^{Y_0}. $注意当$ t\leq\tau_n $时, $ \hat{h}_t = \hat{h}_t^n $, 由(3.4)式则有

$ \mathbb{E}^n\hat{Y}_{\tau_n} = \mathbb{E}^n\left(e^{Y_{\tau_n}}e^{ \int_0^{\tau_n}L(s, X_s, \hat{h}_s)ds} \right) = e^{Y_0}, $

$ Y $有界, 则有

$ e^{-|Y|_{s^\infty(\mathbb{R})}}{\mathbb{E}^n\left(e^{ \int_0^{\tau_n}L(s, X_s, \hat{h}_s)ds} \right)} \leq \mathbb{E}^n\left(e^{Y_{\tau_n}}e^{ \int_0^{\tau_n}L(s, X_s, \hat{h}_s)ds} \right) = e^{Y_0}. $

由上式和Jensen不等式可得, 存在不依赖于$ n $的常数$ C $, 使得$ {\mathbb{E}^n\left( \int_0^{\tau_n}L(s, X_s, \hat{h}_s)ds\right)}\leq C. $由假设2.3 (iii),

$ \begin{equation} \mathbb{E}^n \int_0^{\tau_n}|\hat{h}_s|^2ds\leq C. \end{equation} $ (3.11)

下面证明$ \{M_T^n, n\geq 1\} $是一致可积的, 即关于$ n $一致地有$ \mathbb{E}[M_T^n{\bf 1}_{M_T^n>c}]\rightarrow0, \ c\rightarrow\infty. $显然

$ \begin{equation} \mathbb{E}[M_T^n{\bf 1}_{M_T^n>c}] = \mathbb{E}[M_T^n{\bf 1}_{M_T^n>c, \tau_n = T}]+\mathbb{E}[M_T^n{\bf 1}_{M_T^n>c, \tau_n<T}]. \end{equation} $ (3.12)

注意到$ M_T^n $依概率收敛到$ M_T $, 且$ \mathbb{E}M_T^n = 1 $, 由Fatou引理, $ \mathbb{E}M_T\leq 1 $.故

$ \mathbb{E}[M_T^n{\bf 1}_{M_T^n>c, \tau_n = T}] = \mathbb{E}[M_T{\bf 1}_{M_T>c, \tau = T}]\leq \mathbb{E}[M_T{\bf 1}_{M_T>c}]\rightarrow 0, \ c\rightarrow\infty. $

故(3.12)式右边第一项关于$ n $一致趋于0.而(3.12)式右边第二项有如下估计

$ \begin{aligned} \mathbb{E}[M_T^n{\bf 1}_{M_T^n>c, \tau_n<T}] \leq& \mathbb{E}[M_T^n{\bf 1}_{\tau_n<T}] = \mathbb{P}^n(\tau_n<T)\\ \leq & \mathbb{P}^n\left( \int_0^{\tau_n}|\hat{h}_s|^2ds>n\right)\leq \frac{1}{n}\mathbb{E}^n \int_0^{\tau_n}|\hat{h}_s|^2ds \leq\frac{C}{n}, \end{aligned} $

上式中的等号由测度变换得到, 最后一个不等式由(3.11)式保证.由上面的讨论立即得到了要证的一致可积性.一致可积性加上$ M^n_T $依概率收敛到$ M_T $, 立即可得$ \mathbb{E}M_T = \lim\limits_{n\rightarrow\infty}\mathbb{E}M_T^n = 1 $.定理得证.

定理 3.6  设假设2.2, 假设2.3和假设3.1成立, $ (Y, Z, U)\in S^\infty(\mathbb{R})\times L^2(W)\times L^2(\tilde{N}_{p}) $是BSDE (3.1)的解, 则对任意$ h\in\mathcal{H} $, 有$ J(x, h)\geq Y_0 $当且仅当

$ L(t, X_t, h_t)+Z_tR(t, X_t, h_t) = \varphi(t, X_t, Z_t), \ \mathbb{P}-{\rm a.s.} $

时等号成立, 即$ h = \hat{h} = \gamma(t, X_t, Z_t) $为最优控制, 其中$ \gamma(t, x, z) $是式(3.4)中的Borel可测函数.

  既然$ (Y_t, Z_t, U_t) $是BSDE (3.1)的解, 则有

$ \begin{aligned} dY_t = &-\left[\varphi(t, X_t, Z_t)+\frac{Z_t^2}{2}+ \int_{\mathbb{R}^*}\left(e^{U_t(e)}-U_t(e)-1\right)v(de)\right]dt\\ &+Z_tdW_t + \int_{\mathbb{R}^*}U_t(e)\tilde{N}_p(dt, de)\\ = &-\left[\varphi(t, X_t, Z_t)+\frac{Z_t^2}{2}-Z_tR(t, X_t, h_t)+ \int_{\mathbb{R}^*}\left(e^{U_t(e)}-U_t(e)-1\right)v(de)\right]dt\\ &+Z_tdW^h_t + \int_{\mathbb{R}^*}U_t(e)\tilde{N}_p(dt, de), \quad Y_T = g(X_T). \end{aligned} $

由Itô公式

$ \begin{align} de^{Y_t} = &-e^{Y_t}\left[\varphi(t, X_t, Z_t)-Z_tR(t, X_t, h_t)\right]dt +e^{Y_t}Z_tdW^h_t\\ &+ \int_{\mathbb{R}^*}e^{Y_t}\left(e^{U_t(e)}-1\right)\tilde{N}_p(dt, de). \end{align} $ (3.13)

定义

$ \hat{Y}_t = e^{Y_t}\exp\left( \int_0^t \left[\varphi(s, X_s, Z_s)-Z_sR(s, X_s, h_s)\right]ds \right). $

对上式用分部积分公式, 再将(3.13)式带入, 可得

$ \hat{Y}_T = \hat{Y}_0+ \int_0^T \hat{Y}_tZ_tdW^h_t+ \int_0^T \int_{\mathbb{R}^*} \hat{Y}_t\left(e^{U_t(e)}-1\right)\tilde{N}_p(dt, de). $

注意$ L(t, x, h) $$ Y $都有界, 由$ \hat{Y} $的定义知$ \hat{Y} $是有界过程, 又$ U $有界, 故上式后两项中的随机积分期望为0.因此\ $ \hat{Y}_0 = \mathbb{E}^h\hat{Y}_T $, 即

$ e^{Y_0} = \mathbb{E}^h\exp\left( \int_0^T \left[\varphi(s, X_s, Z_s)-Z_sR(s, X_s, h_s)\right]ds+Y_T \right). $

注意到$ Y_T = g(X_T) $, 再由式(3.2)立即可得

$ \begin{equation} J(x, h) = \log\mathbb{E}^h\left[\exp\left({ \int_0^T L(s, X_s, h_s)}ds+g(X_T)\right)\right]\geq Y_0. \end{equation} $ (3.14)

因为$ \varphi(s, x, z) = L(s, x, \gamma(s, x, z))+zR(s, x, \gamma(s, x, z)), $重复前面的证明过程, 可得当$ h_t = \hat{h}_t = \gamma(t, X_t, Z_t) $时, 式(3.14)取等号, 即$ u(x) = Y_0. $定理3.5已证明$ \hat{h}_t $是一个可行性控制, 因此$ \hat{h}_t $是最优控制.定理得证.

参考文献
[1] Whittle P. Risk-sensitive optimal control[M]. Chichester: John Wiley and Sons, 1990.
[2] Bielecki T R, Pliska S R. Risk-sensitive dynamic asset management[J]. Appl. Math. Optim., 1999, 39: 337–360. DOI:10.1007/s002459900110
[3] Fleming W H, McFneaney W. Risk sensitive control on an infinite time horizon[J]. SIAM J. Control Optim., 1995, 33: 1881–1915. DOI:10.1137/S0363012993258720
[4] Kuroda K, Nagai H. Risk sensitive portfolio optimization on an infinite time horizon[J]. Stoch. Rep., 2002, 73(3-4): 309–331. DOI:10.1080/1045112021000025961
[5] Davis M, Lleo S. Jump-diffusion risk-sensitive asset management I:diffusion factor model[J]. SIAM J. Finan. Math., 2011, 2(1): 22–54.
[6] Davis M, Lleo S. Jump-diffusion risk-sensitive asset management Ⅱ:jump-diffusion factor model[J]. SIAM J. Contr. Optim., 2013, 51(2): 1441–1480. DOI:10.1137/110825881
[7] Bellman R. Dynamic programming[M]. Princeton: Princeton Univ. Press, 1957.
[8] Bismut J M. Conjugate convex functions in optimal stochastic control[J]. J. Math. Anal. Appl., 1973, 44: 384–404. DOI:10.1016/0022-247X(73)90066-8
[9] Pardoux E, Peng S. Adapted solution of a backward stochastic differential equations[J]. Sys. Contr. Lett., 1990, 14: 55–61. DOI:10.1016/0167-6911(90)90082-6
[10] Pardoux E, Peng S. Backward stochastic differential equations and quasilinear parabolic partial differential equations[J]. Lect. Notes Control Inform. Sci., 1992, 176: 200–217.
[11] EL Karoui N, Hamadene S. BSDEs and risk-sensitive control, zero-sum and nonzero-sum game problems of stochastic functional differential equations[J]. Stoch. Proc. Appl., 2003, 107(1): 145–169. DOI:10.1016/S0304-4149(03)00059-0
[12] Kobylanski M. Backward stochastic differential equations and partial equations with quadratic growth[J]. Ann. Prob., 2000, 28(2): 558–602. DOI:10.1214/aop/1019160253
[13] Briand P, Hu Y. BSDE with quadradic growth and unbounded terminal value[J]. Prob. The. Relat. Field, 2006, 136: 604–618. DOI:10.1007/s00440-006-0497-0
[14] Briand P, Hu Y. Quadratic BSDEs with convex gegerators and unbounded terminal conditions[J]. Prob. The. Relat. Field, 2008, 141: 543–567. DOI:10.1007/s00440-007-0093-y
[15] Fuhrman M, Hu Y and Tessitore G. On a class of stochastic optimal control problems related to BSDEs with quadratic growth[J]. SIAM J. Control Optim., 2006, 45(4): 1279–1296. DOI:10.1137/050633548
[16] Morlais M A. Utility maximization in a jump market model[J]. Stoch., 2009, 81(1): 1–27. DOI:10.1080/17442500802201425
[17] Ikeda N, Watanabe S. Stochastic differential equations and diffusion processes[M]. Amsterdam: North-Holland Publ. Co., 1989.
[18] Becherer D. Bounded solutions to backward SDE's with jumps for utility optimization and indifference hedging[J]. Ann. Appl. Prob., 2006, 16(4): 2027–2054. DOI:10.1214/105051606000000475
[19] Briand P, Confortola F. Quadratic BSDEs with random terminal time and elliptic PDEs in infinite dimension[J]. J. URL., 2008, 13(54): 1529–1561.