Markov链的收敛性在Markov链蒙特卡洛(MCMC)方法和非线性时间序列分析中有广泛的应用. 耦合方法(coupling method) 在随机过程中有广泛的应用, 耦合方法已成为研究$ Markov $过程稳定性的一个重要工具. 陈木法([1])对概率距离和耦合方法做了一些总结, 同时研究了全变差范数意义下时齐马氏链的收敛性. 文献[2, 3, 4]用耦合方法研究非时齐马氏链的收敛性和时齐马氏链$ f $指数遍历.文献[5]系统地研究了离散时间时齐马氏链的随机稳定性.
为了更进一步研究了时齐马氏链的收敛性, 本文先证得一个关于基本耦合和$ f $范数的等式, 然后利用该等式和耦合方法, 在$ f- $范数的意义下, 研究离散时间一般状态空间下时齐马氏链的收敛性. 得到了一个时齐马氏链的收敛的充分条件.
设$ (X, \rho, \mathscr{B}(X)) $是波兰空间. 为叙述方便, 先引入几个记号. 设$ g $是$ X $上的可测函数, $ \mu $是$ \mathscr{B}(X) $上的符号测度, $ K $是$ (X, \mathscr{B}(X)) $上的可测核. 记
定义1 设$ \mu $是$ \mathscr{B}(X) $上的符号测度, $ g, f $是$ \mathscr{B}(X) $上的可测函数, 定义$ \mu $的全变差范数为
定义$ \mu $的$ f $范数为
说明: $ \mu $可以是测度, 也可以是函数, 还可以是点.
设$ \Phi=\{\Phi_0, \Phi_1, \cdot \cdot \cdot, \Phi_n, \cdot \cdot \cdot\} $是$ (X, \rho, \mathscr{B}(X)) $上的时齐马氏链, 设$ P(x, dy) $(或简记为$ P $)是$ (X, \rho, \mathscr{B}(X)) $上的概率核, 递推地定义$ P $的第$ n $步转移概率为$ P $的$ n $次幂$ P^{n} $.
设$ \mathscr{P}(X) $为$ X $上的全体概率测度, $ x_{0} $为$ X $上某个给定的点(等价地任意给定的点$ x_{0} $). 设$ \mu\in\mathscr{P}(X) $, 定义
记
定义2 设$ \mu_1, \mu_2 $是$ \mathscr{B}(X) $上的任意概率测度, $ \widetilde{\mu} $是$ \mathscr{B}(X)\times \mathscr{B}(X) $上的概率测度, 称$ \widetilde{\mu} $是$ \mu_1 $与$ \mu_2 $的耦合, 若满足边缘性:
记$ K(\mu_1, \mu_2) $为$ \mu_1 $与$ \mu_2 $的全体耦合.
陈木法([1])、Lindvall([6])、张绍义([7])研究过时齐$ Markov $链的收敛性, 不过他们都是从全变差范数角度研究的. 本文将推导得出更加一般的$ f $范数角度时齐$ Markov $链的收敛性的一个充分条件.
定理1 设$ (X, \rho, \mathscr{B}(X)) $是波兰空间, 设$ \Phi=\{\Phi_0, \Phi_1, \cdot \cdot \cdot, \Phi_n, \cdot \cdot \cdot\} $是取值于$ X $上的时齐马氏链, $ P $是$ \Phi $的转移概率核. 如果满足:
$ (i) \forall x\in X, $有$ P(x, \cdot)\in\mathscr{M} $;
$ (ii) $ 存在耦合和与$ x, y $无关的常数$ 0\leq c< 1 $使得
其中$ \widetilde{P}(x, y;du, dv) $为$ {P}(x, du) $与$ {P}(y, dv) $的耦合.
那么, 存在$ \mathscr{M} $上唯一的平稳分布$ \pi $, 使得对$ \mathscr{M} $上的任意概率测度$ \mu $, 当$ n\rightarrow \infty $时有
注: 当$ f\equiv 1 $, 则$ f $范数变成了全变差范数.
引理1 [6] 设$ \mu_1, \mu_2 $是$ \mathscr{B}(X) $上的任意概率测度, 令$ \mu{'}=\mu_1+\mu_2 $记
易得$ 0\leq\gamma\leq1, v_1, v_2 $是$ \mathscr{B}(X) $上的两个测度, $ Q $是$ \mathscr{B}(X)\times\mathscr{B}(X) $上的测度. 令
则$ \overline{\mu} $是$ \mu_1 $与$ \mu_2 $的耦合, 称$ \overline{\mu} $是$ \mu_1 $与$ \mu_2 $的基本耦合.
点测度$ \delta_x $与概率测度$ \mu $的基本耦合记为$ \overline{\mu} $.
记$ \varphi(x, y):=d(x, y)[f(x)+f(y)], $可测函数$ f\geq 1 $, 其中
定理2 设$ \mu_1, \mu_2 $是任意概率测度, $ \overline{\mu} $是$ \mu_1 $与$ \mu_2 $的基本耦合. 则有
证
于是, 只需证
往证之. $ (a) $当$ \gamma=1 $时,
从而有
$ (b) $当$ \gamma<1 $时, 当$ x=y $时,
所以有
定理获证.
引理2 设$ \mu_1, \mu_2 $是任意概率测度, $ P $是波兰空间$ (X, \rho, \mathscr{B}(X)) $上的概率核, $ \overline{\mu} $是$ \mu_1 $与$ \mu_2 $的基本耦合, $ \widetilde{P}(x, y;du, dv) $为$ {P}(x, du) $与$ {P}(y, dv) $的耦合. 则有
证 要证明$ (2.2) $式成立, 先证明$ \overline{\mu}\widetilde{P} $是$ \mu_1P $与$ \mu_2P $的耦合. 下面验证边缘性条件:
同理可证$ \overline{\mu}\widetilde{P}(X\times B)=\mu_2P(B) $. 故$ \overline{\mu}\widetilde{P} $是$ \mu_1P $与$ \mu_2P $的耦合.
令$ |g|\leq f $, 则有$ g(u)-g(v)\leq\varphi(u, v) $.于是
同理:
于是有
在上面不等式中, 对$ |g|\leq f $求上确界, 得
(2.2)式得证.
引理3 设$ P $是波兰空间$ (X, \rho, \mathscr{B}(X)) $上的概率核, $ \mu_1, \mu_2 $是任意概率测度, 若存在耦合和与$ x, y $无关的常数$ 0\leq c\leq 1 $使得
其中, $ \widetilde{P}(x, y;du, dv) $为$ {P}(x, du) $与$ {P}(y, dv) $的耦合.
则对任意概率测度$ \mu_1, \mu_2 $有
证 设$ \overline{\mu} $是$ \mu_1 $与$ \mu_2 $的基本耦合, 由$ (2.2)(2.3) $式可得
引理4 在满足引理$ 3 $的条件下, 若$ P\in \mathscr{M} $, 任意概率测度$ \mu\in \mathscr{M} $, 则$ \mu P\in \mathscr{M} $.
证 设$ \overline{\mu} $是点测度$ \delta_x $与概率测度$ \mu $的基本耦合, 由$ (1) $式可得
因为$ \mu\in \mathscr{M}, P\in \mathscr{M}, $故有
注意到, 在满足引理$ 3 $的条件下, 有
所以
从而$ \mu P\in \mathscr{M} $.
引理5 设$ \mu_1, \mu_2 $是任意概率测度, 若$ \mu_1, \mu_2\in\mathscr{M} $, 则$ \|\mu_1-\mu_2\|_{f}< \infty. $
证 由于$ \mu_1, \mu_2\in\mathscr{M} $, 从而有
引理6 设$ P $是波兰空间$ (X, \rho, \mathscr{B}(X)) $上的概率核, 若存在$ 0\leq c < 1 $使得对任意概率测度$ \mu_1, \mu_2 $有
则对$ \forall m\in Z_{+}, \mu\in \mathscr{M} $, 有
证 由三角不等式得
引理7 设$ P $是波兰空间$ (X, \rho, \mathscr{B}(X)) $上的概率核, 若存在$ 0\leq c < 1 $使得对任意概率测度$ \mu_1, \mu_2 $有
则对$ \forall\mu\in \mathscr{M}, \; \; \{\mu P^{n}:n\geq 1\} $是$ Cauchy $列.
证 对$ \forall n, m\in Z_{+}, \mu\in \mathscr{M} $, 应用引理3和引理6有
故$ \{\mu P^{n}:n\geq 1\} $是$ Cauchy $列.
引理8 设$ (X, \rho, \mathscr{B}(X)) $是波兰空间, $ \mu_1, \mu_2 $是任意概率测度, 定义
则$ (\mathscr{M}, W) $是完备的度量空间.
证 证明见文献[8]第28–29页.
为了证明定理$ 1 $, 下面分三步来进行:
(a) 先证明存在概率测度$ \pi\in\mathscr{M} $, 使得当$ n\rightarrow \infty $时有$ \|\mu P^{n}-\pi\|_{f}\rightarrow 0; $
(b) 再证明$ \pi $是平稳分布;
(c) 最后证明$ \pi $的唯一性.
证 $ (a) $任取$ \mu\in \mathscr{M} $, 由引理$ 4 $可归纳地证明$ \{\mu P^{n}:n\geq 1\}\subseteq\mathscr{M} $. 由引理$ 7 $和引理$ 8 $知: $ \{\mu P^{n}:n\geq 1\} $是完备的度量空间$ (\mathscr{M}, W) $上的$ Cauchy $列. 于是存在概率测度$ \pi\in\mathscr{M} $, 使得当$ n\rightarrow \infty $时有
$ (b) $在定理条件$ (ii) $下, 由引理$ 3 $有
又由$ (a) $得,
于是$ \|{\pi P}-{\pi}\|_{f}=0 $, 即$ \pi P=\pi $. 证明了$ \pi $是平稳分布.
$ (c) $下面证明$ \pi $的唯一性: 设$ \pi_{0}\in\mathscr{M} $也是$ P $的平稳分布, 则有
表明了$ \|{\pi_{0}}-{\pi}\|_{f}=0 $, 即$ \pi_{0}=\pi $.
定理1的说明
说明1: 条件$ (ii) $可改为, 存在常数$ 0\leq c<1 $使得$ \|{\mu_1P}-{\mu_2P}\|_{f}\leq c\|\mu_1-\mu_2\|_{f}. $
说明2: 条件$ (ii) $可改为, 存在与$ x, y $无关的常数$ c $且$ 0\leq c<1 $使得$ \|P(x, du)-P(y, dv)\|_{f}\leq c\varphi(x, y). $
说明2的证明: 由定理$ 2 $知$ \|P(x, du)-P(y, dv)\|_{f}= \displaystyle{\int}\widetilde{P}(x, y;du, dv)\varphi(u, v) $其中$ \widetilde{P}(x, y;du, dv) $为$ {P}(x, du) $与$ {P}(y, dv) $的基本耦合. 易于验证$ \overline{\mu}\widetilde{P} $也是$ \mu_1P $与$ \mu_2P $的耦合. 再由引理3有:
说明3: 条件$ (ii) $可改为, 对任意函数$ |g|\leq f $, 存在与$ x, y $无关的常数$ c $且$ 0\leq c<1 $使得$ |Pg(x)-Pg(y)|\leq c\varphi(x, y). $
说明3的证明: 设$ \overline{\mu} $是$ \mu_1 $与$ \mu_2 $的$ \varphi $最优耦合,