数学杂志  2016, Vol. 36 Issue (5): 1097-1102   PDF    
扩展功能
加入收藏夹
复制引文信息
加入引用管理器
Email Alert
RSS
本文作者相关文章
宋娟
张铭
连续时间非时齐马氏过程的广义Dobrushin系数的估计
宋娟1, 张铭2    
1. 湖北经济学院, 统计学院, 湖北省 武汉市 430205;
2. 中国政法大学, 科学技术教学部, 北京市 102249
摘要:本文研究了非时齐马氏过程的广义Dobrushin系数的估计问题.在将经典Dobrushin遍历系数推广为加权的遍历系数的基础上, 利用了矩阵拆分的方法, 得到了对这种广义遍历系数的估计方法, 推广了时齐马氏过程关于遍历系数的估计结果, 借此可进一步得到有关遍历性的判定结论.
关键词非时齐马氏过程    遍历系数    V范数    
THE ESTIMATE OF GENERALIZED ERGODIC COEFFICIENT FOR CONTINUOUS-TIME INHOMOGENEOUS MARKOV PROCESSES
Song Juan1, Zhang Ming2    
1. School of Statistics, Hubei University of Economics, Wuhan, 430205;
2. Department of science and technology, China University of Political science and Law, Beijing, 102249
Abstract: This artical studies the estimate of the generalized ergodic coefficient for inhomogeneous Markov processes. On the basis of the generalization of the classical Dobrushin ergodic coefficient, we decompose the matrix and then abtain the estimate of the generalized ergodic coefficient, extend the result of the estimation of the ergodic coefficient for homogeneous Markov processes, with which we can get a criterion for the geometric ergodicity.
Key words: Inhomogeneous Markov processes     Ergodic coefficient     V-norm    
1 引言

在研究遍历性的问题时会涉及到很多不同的方法:如最小非负解理论, 谱理论, 泛函不等式以及遍历系数等, 其中应用遍历系数来进行遍历性推断的的方法是一种较为简便且实用的方法.

遍历系数有很多种, 其中最重要也是最常用的一种就是Dobrushin遍历系数$\delta(P)$.Rhodius[10]和Neumann, Schneider[9]都曾研究过一些不同范数下的遍历系数, 并证明了这些遍历系数都可以被Dobrushin遍历系数所控制.

$(E, \mathscr{E})$是一个可测空间, $P=\big(P_{ij}\big)$是其上的一个随机概率矩阵, $\pi$$P$的不变测度, [4]定义了$P$的Dobrushin遍历系数为

$ \begin{equation} \delta(P)=\frac{1}{2}\text{ess} _{\pi}\sup\limits_{x, y\in E}\|P(x, \cdot)-P(y, \cdot)\|_{\rm{Var}}. \end{equation} $ (1.1)

这里$\|\mu\|_{\rm{Var}}:= 2\sup\limits_{A\in \mathscr{E}}|\mu(A)|=\sup\{\displaystyle\int_{E} fd\mu:|f|\leq1\}$是关于符号测度$\mu$的全变差.

关于$\delta$系数的研究已经进行了很多年, 并且得到了很多重要的结果[2].

近些年来, Hairer, Mattingly[5, 6]等人在Meyn, Tweedie[8]的基础上, 通过引入$V$范数, 推广得到了$L_{V}$空间及其对偶空间$L_{V}^{*}$, 并在其上讨论指数收敛、多项式收敛、次指数收敛等一系列问题, 综合了drift条件、Lyapunov函数等得到了很好的结果.$V$范数实际上可以看作是一般常用范数的推广, 在应用其进行具体研究时, 可以发现它开拓了研究视野, 提供了新的方法和理念, 使研究过程得到简化.因此, 越来越多的人投身于$V$范数的相关研究中, 并将其推广到了更广泛的领域.[7]就是将$V$范数的概念与$\delta$系数、遍历性相联系, 推广得到了$\delta_{V}$系数:定义符号测度$\mu$$V$范数为$\|\mu\|_{V}:=\sup\{\int_{E} fd\mu:\|f\|_{V}\leq1\}$, 其中$V:E\rightarrow[1, \infty]$是一个$\pi$-a.s.的有限函数,

$ \begin{equation} \|f\|_{V}:=\sup\limits_{x\in E}\frac{|f(x)|}{V(x)}. \end{equation} $ (1.2)

于是对于马氏核$P(x, A)(x\in E, A\in \mathscr{E})$定义

$ \begin{equation*} \|P\|_{V}:=\sup\limits_{x\in E}\frac{\|P(x, \cdot)\|_{V}}{V(x)}. \end{equation*} $

由此就将$\delta(P)$推广为$\delta_{V}(P)$.

定义1  对于函数$V:E\rightarrow[1, \infty)$, 定义随机概率矩阵$P$关于$V$的广义Dobrushin系数为

$ \begin{equation} \delta_{V}(P):= \text{ess}_{\pi}\sup\limits_{x, y\in E}\frac{1}{V(x)+V(y)}\|P(x, \cdot)-P(y, \cdot)\|_{V}. \end{equation} $ (1.3)

根据这个定义, 显然有$\delta_{V}(I)=1$.并且由此得到了指数遍历的另一种判定方法.

一个$\psi$不可约非周期的马氏链$X=(X_{n})_{n\geq0}$是指数遍历的当且仅当$X$是遍历的且其不变测度为$\pi$, 还存在一个$\pi$-a.s.有限函数$V:E\rightarrow[1, \infty]$使得$\pi(V)<\infty$并且当$n$足够大时有$\delta_{V}(P^{n})<1$.

由此可以看出$\delta_{V}(P)$与遍历性有直接的联系, 因此对遍历性的判定就转换为了对$\delta_{V}(P)$的估计问题.其实从[7]中的相关性质可以很明显的看出, 对于离散时间的马氏链来说有

$ \delta_{V}(P_{1}P_{2}\cdots P_{n})\leq\delta_{V}(P_{1})\delta_{V}(P_{2})\cdots\delta_{V}(P_{n}). $

既然离散时间的$\delta_{V}(P)$是被连乘积的形式控制的, 那么连续时间时又是怎样的情形呢?

2 主要结果和证明

为了结果陈述的方便, 先给出一些基本符号及假设.假设状态空间$E$上的非时齐的连续时间马氏过程$P_{s, t}$满足以下条件

(1) 对任意的$t\geq u\geq s\geq0, $都有$P_{s, t}=P_{s, u}P_{u, t}$;

(2) 对任意的$t\geq0, $都有$\lim_{\vartriangle t\downarrow0}P_{t, t+\vartriangle t}=\lim_{\vartriangle t\downarrow0}P_{t-\vartriangle t, t}=P_{t, t}=I=(\delta_{ij})$, 即$\lim_{\vartriangle t\downarrow0}P_{s, t+\vartriangle t}=\lim_{\vartriangle t\downarrow0}P_{s, t-\vartriangle t}=P_{s, t}$;

(3) 对任意的$t\geq0, $都有$Q_{t}:=\lim_{\vartriangle t\downarrow0}\frac{P_{t, t+\vartriangle t}-I}{\vartriangle t}=\lim_{\vartriangle t\downarrow0}\frac{P_{t-\vartriangle t, t}-I}{\vartriangle t}$.

由此可以得到$P_{s, t}$中的各个元素关于$t$是连续可微的[3].于是就有

定理2  对于非时齐的连续时间马氏过程$P_{s, t}, $若有$\sup_{i}q_{i}(t)<\infty, t\geq0$, 则

$ \delta_{V}(P_{s, t})\leq\text{e}^{-\displaystyle\int_{s}^{t}\tilde{\alpha}_{V}(Q_{u})du}. $

其中

$ \tilde{\alpha}_{V}(Q_{t}):=\inf\limits_{i\neq j}\left[q_{ij}(t)+q_{ji}(t) +\frac{1}{V_{i}+V_{j}}\sum\limits_{k\neq i, j}\left(q_{ik}(t)V_{i}+q_{jk}(t)V_{j}-|q_{ik}(t)-q_{jk}(t)|V_{k}\right)\right]. $

  由于$P_{s, t}$中的各个元素关于$t$是连续可微的, 而根据定义, $\delta_{V}(P_{s, t})$就是$P_{s, t}$中的各个元素经过计算得到的, 所以$\delta_{V}(P_{s, t})$关于$t$也是连续可微的.那么想要证明$\delta_{V}(P_{s, t})\leq\text{e}^{-\displaystyle\int_{s}^{t}\tilde{\alpha}_{V}(Q_{u})du}$, 其实只需要证得

$ \frac{d\ln\left(\delta_{V}(P_{s, t})\right)}{dt}\leq-\tilde{\alpha}_{V}(Q_{t}) $

即可.这里用到[7]中证得的关于$\delta_{V}(P)$系数的一个非常重要的性质

$ \delta_{V}(P_{1}P_{2})\leq\delta_{V}(P_{1})\delta_{V}(P_{2}). $

由此可以得出对于所有的$s<t$, 都有

$ \delta_{V}(P_{s, t+\vartriangle t})=\delta_{V}(P_{s, t}P_{t, t+\vartriangle t})\leq\delta_{V}(P_{s, t})\cdot\delta_{V}(P_{t, t+\vartriangle t}), $

也就是

$ \delta_{V}(P_{s, t+\triangle t})-\delta_{V}(P_{s, t})\leq\delta_{V}(P_{s, t})\cdot(\delta_{V}(P_{t, t+\triangle t})-1). $

那么对于所有的$\triangle t>0$来说就有

$ \frac{\delta_{V}(P_{s, t+\triangle t})-\delta_{V}(P_{s, t})}{\triangle t}\leq\delta_{V}(P_{s, t})\cdot\frac{\delta_{V}(P_{t, t+\triangle t})-1}{\triangle t}. $

此时再令$\triangle t\downarrow0$, 即得

$ \lim\limits_{\triangle t\downarrow0}\frac{\delta_{V}(P_{s, t+\triangle t})-\delta_{V}(P_{s, t})}{\triangle t}\leq\delta_{V}(P_{s, t})\cdot\lim\limits_{\triangle t\downarrow0}\frac{\delta_{V}(P_{t, t+\triangle t})-1}{\triangle t}. $

此时注意到根据之前的假定, 有$\lim_{\vartriangle t\downarrow0}\frac{P_{t, t+\triangle t}-I}{\triangle t}=Q_{t}$,即

$ P_{t, t+\triangle t}=I+Q_{t}\triangle t+o(\triangle t), $

也就是$P_{t, t+\triangle t}$具有如下矩阵形式

$ \left( \begin{array}{ccccc} 1-q_{1}(t)\triangle t+o_{11}(\triangle t)&q_{12}(t)\triangle t+o_{12}(\triangle t) &\cdots&q_{1n}(t)\triangle t+o_{1n}(\triangle t)&\cdots \\ q_{21}(t)\triangle t+o_{21}(\triangle t)&1-q_{2}(t)\triangle t+o_{22}(\triangle t) &\cdots&q_{2n}(t)\triangle t+o_{2n}(\triangle t)&\cdots \\ \vdots &\vdots&\vdots&\vdots&\vdots \\ \end{array} \right). $

再根据$\delta_{V}(P)$的定义, 有

$ \delta_{V}(P_{t, t+\triangle t}) =\sup \limits_{i\neq j}\frac{1}{V_{i}+V_{j}}\sum \limits_{k}|P_{t, t+\triangle t}(i, k)-P_{t, t+\triangle t}(j, k)|V_{k}\\ =\sup \limits_{i\neq j}\frac{1}{V_{i}+V_{j}}[|1-q_{i}(t)\triangle t-q_{ji}(t)\triangle t|V_{i}+|1-q_{j}(t)\triangle t-q_{ij}(t)\triangle t|V_{j}\\ \quad+\sum \limits_{k\neq i, j}|q_{ik}(t)\triangle t-q_{jk}(t)\triangle t|V_{k}]+o(\triangle t). $

此时考虑到, 由于$\sup_{i}q_{i}(t)<\infty$, 所以存在$\varepsilon_{t}>0$, 使得对于任意的$\triangle t<\varepsilon_{t}$时都有

$ \mbox{对于所有的}i, j, 1-q_{i}(t)\triangle t-q_{ji}(t)\triangle t>0, $

于是可以得到

$ \delta_{V}(P_{t, t+\triangle t})= \sup\limits_{i\neq j}\frac{1}{V_{i}+V_{j}}[\left(1-q_{i}(t)\triangle t-q_{ji}(t)\triangle t\right)V_{i}+\left(1-q_{j}(t)\triangle t-q_{ij}(t)\triangle t\right)V_{j}\\ +\sum\limits_{k\neq i, j}|q_{ik}(t)\triangle t-q_{jk}(t)\triangle t|V_{k} ]+o(\triangle t), $

则综上有

$ \lim\limits_{\triangle t\downarrow0}\frac{\delta_{V}(P_{t, t+\triangle t})-1}{\triangle t}\\ = -\inf\limits_{i\neq j}\frac{1}{V_{i}+V_{j}}[q_{i}(t)V_{i}+q_{j}(t)V_{j}+q_{ij}(t)V_{j}+q_{ji}(t)V_{i} -\sum\limits_{k\neq i, j}|q_{ik}(t)-q_{jk}(t)|V_{k}], $

由于$q_{i}(t)=\sum_{k\neq i}q_{ik}(t),$所以上式可转化为

$ \lim\limits_{\triangle t\downarrow0}\frac{\delta_{V}(P_{t, t+\triangle t})-1}{\triangle t}\\ = -\inf\limits_{i\neq j}\frac{1}{V_{i}+V_{j}}[\sum\limits_{k\neq i}q_{ik}(t)V_{i}+\sum\limits_{k\neq j}q_{jk}(t)V_{j} +q_{ij}(t)V_{j}+q_{ji}(t)V_{i}\\ -\sum\limits_{k\neq i, j}|q_{ik}(t)-q_{jk}(t)|V_{k}]\\ = -\inf\limits_{i\neq j}\frac{1}{V_{i}+V_{j}}[\sum\limits_{k\neq i, j}q_{ik}(t)V_{i}+\sum\limits_{k\neq i, j}q_{jk}(t)V_{j} +q_{ij}(t)V_{j}+q_{ji}(t)V_{i}+q_{ij}(t)V_{i}+q_{ji}(t)V_{j}\\ -\sum\limits_{k\neq i, j}|q_{ik}(t)-q_{jk}(t)|V_{k}]\\ = -\inf\limits_{i\neq j}\frac{1}{V_{i}+V_{j}}[(q_{ij}(t)+q_{ji}(t))(V_{i}+V_{j})+\sum\limits_{k\neq i, j}(q_{ik}(t)V_{i}+q_{jk}(t)V_{j}\\-|q_{ik}(t)-q_{jk}(t)|V_{k})]\\ = -\inf\limits_{i\neq j}[q_{ij}(t)+q_{ji}(t)+\frac{1}{V_{i}+V_{j}}\sum\limits_{k\neq i, j}(q_{ik}(t)V_{i}+q_{jk}(t)V_{j} -|q_{ik}(t)-q_{jk}(t)|V_{k})]\\ = -\tilde{\alpha}_{V}(Q_{t}). $

于是综上可知

$ \lim\limits_{\triangle t\downarrow0}\frac{\delta_{V}(P_{s, t+\triangle t})-\delta_{V}(P_{s, t})}{\triangle t}\leq -\delta_{V}(P_{s, t})\tilde{\alpha}_{V}(Q_{t}). $

类似的方法, 也可以得到

$ \lim\limits_{\triangle t\downarrow0}\frac{\delta_{V}(P_{s, t})-\delta_{V}(P_{s, t-\triangle t})}{\triangle t}\leq -\delta_{V}(P_{s, t})\tilde{\alpha}_{V}(Q_{t}). $

于是最终得到所要的

$ \frac{d\ln(\delta_{V}(P_{s, t}))}{dt}\leq-\tilde{\alpha}_{V}(Q_{t}). $

至此证明完毕.

根据前面的定义可知经典Dobrushin遍历系数就是当$V(x)\equiv1$时的特例, 于是可得

推论3  对于非时齐的连续时间马氏链$P_{s, t}, $若有$\sup_{i}q_{i}(t)<\infty, t\geq0$, 则

$ \delta(P_{s, t})\leq\text{e}^{-\displaystyle\int_{s}^{t}\tilde{\alpha}(Q_{u})du}. $

其中

$ \tilde{\alpha}(Q_{t}):=\inf\limits_{i\neq j}\left[q_{ij}(t)+q_{ji}(t) +\sum\limits_{k\neq i, j}\min(q_{ik}(t), q_{jk}(t))\right]. $

  此处只需令定理2中的$V=1$, 即得

$\tilde{\alpha}(Q_{t})=\tilde{\alpha_{1}}(Q_{t})=\inf\limits_{i\neq j}\left[q_{ij}(t)+q_{ji}(t) +\frac{1}{2}\sum\limits_{k\neq i, j}\left(q_{ik}(t)+q_{jk}(t)-|q_{ik}(t)-q_{jk}(t)|\right)\right]. $

再由已知事实$(a+b)-|a-b|=2\min(a, b), $即可得到结论.

这里的证明方法是从遍历系数本身的定义出发, 使本文对其控制上界中的$\tilde{\alpha}$$\tilde{\alpha}_{V}$的来源有了更清楚的认识.由以上得到的结果可以看出, 无论是$\delta$系数还是$\delta_{V}$系数, 其在连续时间情形的控制上界都是由指数形式的控制量所控制的, 这恰恰与离散时间的情况是相对应的.

参考文献
[1] 王伟刚. 一般随机环境中马氏链的强大数律[J]. 数学杂志, 2011, 31(3): 481–487.
[2] Anderson W J. Continuous-Time Markov Chains An Applications-Oriented Approach[M]. New York: Springer-Verlag, 1991.
[3] Chen Mufa. From Markov Chains to Non-equilibrium Particle Systems[M]. Beijing: World Scientufic, Second Edition, 2004.
[4] Dobrushin R L. Central limit theorem for non-stationary Markov chains Ⅰ, Ⅱ[J]. Theory of Probability and its applications, 1956, 1: 63-80, 329–383.
[5] Hairer M, Mattingly J C. Spectral gaps in Wassersttein distances and the 2D stochastic NavierStokes Equations[J]. The Annals of Probability, 2008, 36(6): 2050–2091. DOI:10.1214/08-AOP392
[6] Hairer M, Mattingly J C. Yet another look at Harris' ergodic theorem for Markov chains[J]. Seminar on Stochastic Analysis Random Fields and Applications Ⅵ Progress in Probability, 2011, 63: 109–117.
[7] Mao Yonghua, Zhang Ming, Zhang Yuhui. A Generalization of Dobrushin Coefficient[J]. Chinese Journal of Applied Probability and Statistics, 2013, 29(5): 489–494.
[8] Meyn S P, Tweedie R L. Markov Chains and Stochastic Stability[M]. London: Springer-Verlag, 1996.
[9] Neumann M, Schneider H. The convergence of general products of matrices and the weak ergodicity of Markov chains[J]. Linear Algebra and its Appl., 1999, 287: 307–314. DOI:10.1016/S0024-3795(98)10196-9
[10] Rhodius A. On the maximum of ergodicity coefficients, the Dobrushin ergodicity coefficient, and products of stochastic matrices[J]. Linear Algebra and its Appl., 1997, 253: 141–154. DOI:10.1016/0024-3795(95)00706-7