自Robbins提出经验Bayes方法以来, EB检验问题在文献中已有非常多的研究, 但是这些文献大部分都是在完全样本情形下考虑的[1-7], 然而在实际问题中, 随机样本往往具有不完全性(如舍入数据, 缺失数据和删失数据等).在大多数统计分析中, 常常假设数据本身是精确的, 但在实际问题中, 我们的数据可能因某些因素的影响而具有舍入误差, 我们称这样的数据为舍入数据.本文将在舍入数据下讨论Lomax分布形状参数的经验Bayes(EB)单侧检验问题.考虑如下Lomax分布[8], 当给定 $\theta$时, 随机变量 $X$的条件概率密度为
其中 $\lambda_0>0$为已知的尺度参数, $\theta$为形状参数.样本空间为 $\Omega=\{x|x>0\}$, 参数空间为 $\Theta=\{\theta|\theta>0\}$.
本文考虑模型(1.1) 中参数 $\theta$的单侧检验问题
其中 $\theta_0$是给定的常数.对上述假设检验问题, 设损失函数为
其中 $a$为大于零的常数, $d=\{d_0, d_1\}$为行动空间, $d_0$表示接受 $H_0$, $d_1$表示拒绝 $H_0$, I[A]为事件 $A$的示性函数.
设参数 $\theta$的先验分布为 $G(\theta)$, 且 $G(\theta)$未知.随机化判决函数为 $\delta(x)=P\{$接受 $H_0|X=x\}$, 则 $\delta(x)$的风险函数为
其中
令随机变量 $X$的边缘分布为
于是, 经计算得
其中 $f^{(1)}(x)$是 $f(x)$的一阶导数,
由(1.3) 式可知, Bayes检验函数为
其相应的Bayes风险为
上述风险当先验分布 $G(\theta)$已知且 $\delta(x)=\delta_G(x)$时, 是可以达到的.但此处 $G(\theta)$未知, 所以 $\beta(x)$也未知, 故 $\delta_G(x)$无使用价值, 于是引入下面的经验Bayes方法来解决这个问题.
设 $\{X_1, \theta_1\}, \{X_2, \theta_2\}, \cdots, \{X_n, \theta_n\}$ (历史样本)和 $\{X, \theta\}$ (当前样本)为相互独立的随机向量, 其中 $\theta_i(1\leq i\leq n)$与 $\theta$具有共同的先验分布 $G(\theta)$, $X_1, X_2, \cdots, X_n$具有共同的边缘密度 $f(x)$如(1.5) 式所示.由于某些因素, 历史样本 $\{X_i|1\leq i\leq n\}$常常不能被观测到, 我们仅能观测到它的舍入数据 $\{Y_i|1\leq i\leq n\}$, 且
其中 $h(x)$为未知的密度函数, $l>0$为已知的常数, $\{\varepsilon_i|1\leq i\leq n\}$, $\{Y_i|1\leq i\leq n\}$都独立同分布, 且 $\{\varepsilon_i|1\leq i\leq n\}$与 $\{Y_i|1\leq i\leq n\}$之间相互独立.本文中假定 $f(x)\in C_{s, \beta}, x\in \mathcal{R}^1$, 这里 $C_{s, \beta}$表示一类概率密度函数族, 它的 $s$阶导数存在、连续且绝对值不超过 $\beta$, $s\geq4$为正整数.由卷积公式, 可得
记 $h^{(0)}(x)=h(x)$, $h^{(1)}(x)=h'(x)$.于是, 由(1.6) 式和(2.1) 式, 有
为了构造 $\beta(x)$的估计量, 我们首先利用舍入数据 $\{Y_i|1\leq i\leq n\}$来构造 $h^{(r)}(x)(r=0, 1)$的估计量.
令 $K_r(x)(r=0, 1)$为有界的Borel可测函数, 在区间(-1, 1) 之外取值为零, 且对 $r=0, 1$满足下列条件
(A) $ \begin{array}{ll} \displaystyle\frac{1}{t!}\int^1_{-1}u^tK_r(u)du=\left\{ \begin{array}{ll}(-1)^r, & t=r, \\ 0, & t\neq r, t=0, 1, \cdots, r-1, r+1, \cdots, s-1. \end{array}\right. \end{array}$
类似于文献[9], 定义 $h^{(r)}(x)$的递归核估计为
其中 $\{h_n\}$为正数序列, 且 $h_n\downarrow0(n\rightarrow\infty)$.参看文献[10], 可以找到适合上述条件(A)的核函数 $K_r(x)$.
由(2.2) 式和(2.3) 式可知, 定义 $\beta(x)$的估计量为
再由(1.8) 式, EB检验函数定义为
本文中令 $\mbox{E}_n$表示关于 $(Y_1, Y_2, \cdots, Y_n)$的联合分布求均值, 则 $\delta_n(x)$的全面Bayes风险为
按定义, 设 $\vartheta$表示参数 $\theta$的先验分布族, 若对每个 $G\in\vartheta$, 有 $\lim\limits_{n\rightarrow\infty}R_n=R_G$, 则称 $\{\delta_n(x)\}$为关于 $\vartheta$渐近最优(a.o.)的EB检验函数.若对某个 $q>0$, $R_n-R_G=O(n^{-q})$, 则称EB检验函数 $\{\delta_n(x)\}$的收敛速度为 $O(n^{-q})$.
假设文中出现的 $M, M_1, M_2$表示与 $n$无关的常数, 即使在同一表达式中它们也可取不同的值.为证明所给出的EB检验函数的渐近最优性及收敛速度, 需要以下的一些引理.
引理3.1 设 $f^{(r)}_n(x)(r=0, 1)$由(2.5) 式定义, 假定条件 $(A)$成立, 记 $f^{(0)}(x)=f(x)$, $f^{(1)}(x)=f'(x)$.
(a)若 $f^{(r+1)}(x)$关于 $x$连续, 则当 $\lim\limits_{n\rightarrow\infty}\frac{1}{n}\sum^n_{i=1}h_i=0$且 $\lim\limits_{n\rightarrow\infty}nh^{2r+2}_n=\infty$时, 有
(b)若 $f(x)\in C_{s, \beta}$, $s\geq4$为正整数, 则当取 $h_n=n^{-\frac{1}{2(s-1)}}$时, 对于 $0 < \lambda\leq1$有
证 (a)由 $C_r-$不等式和Jensen不等式, 有
首先考虑 $J_{1r}^2$, 由(2.5) 式和假定条件(A)知
将 $h(x-y-h_iu)$在 $x-y$处作Taylor展开到第 $r+2$项, 有
其中 $0 < \xi_{r+1} < 1$.将(3.4) 式代入(3.3) 式, 再利用假定条件 $(A)$可得
因此, 由(3.2) 式有
于是, 可得
于是, 当 $\lim\limits_{n\rightarrow\infty}\frac{1}{n}\sum^n_{i=1}h_i=0$时, 有
再考虑 $J_{2r}$, 由(2.5) 式知
由 $|K_r(x)|\leq M$及 $h_n\downarrow0$, 可知
于是, 当 $\lim\limits_{n\rightarrow\infty}nh^{2r+2}_n=\infty$时, 有
所以当 $\lim\limits_{n\rightarrow\infty}\frac{1}{n}\sum^n_{i=1}h_i=0$且 $\lim\limits_{n\rightarrow\infty}nh^{2r+2}_n=\infty$时, 将(3.6) 和(3.8) 式代入(3.1) 式, 得
注1 若取 $h_n=n^{-\frac{1}{6}}$, 则易知正数序列 $\{h_n, n\geq1\}$满足引理3.1(a)中的条件.
(b)由 $C_r$ -不等式和Jensen不等式, 有
首先考虑 $J_{1r}^{2\lambda}$.因为 $f(x)\in C_{s, \beta}$, 所以易知 $h(x)\in C_{s, \beta}$.将 $h(x-y-h_iu)$在 $x-y$处作Taylor展开到第 $s+1$项, 有
其中 $0 < \xi_s < 1$.将(3.10) 式代入(3.3) 式, 再利用假定条件 $(A)$可得
于是, 可知
当取 $h_n=n^{-\frac{1}{2(s-1)}}$时, 易知对于 $r=0, 1$都有 $h_n=n^{-\frac{1}{2(s-1)}}\leq n^{-\frac{1}{2(s-r)}}$, 于是 $h^{s-r}_n\leq n^{-\frac{1}{2}}$, 所以
因此有
再考虑 $J_{2r}^\lambda$, 当 $h_n=n^{-\frac{1}{2(s-1)}}$时, 由(3.7) 式, 有
将(3.11) 和(3.12) 式代入(3.9) 式可得引理3.1(b)结论, 引理3.1(b)证毕.
引理3.2[2] 设 $R_n$, $R_G$分别由(2.7) 式和(1.9) 式定义, 则有
定理3.1 设 $f^{(r)}_n(x)(r=0, 1)$由(2.5) 式定义, $R_n$, $R_G$分别由(2.7) 和(1.9) 式定义, 假定条件(A)成立, 且下列条件满足
(i) $\{h_n\}$为正数序列, 且 $h_n\downarrow0(n\rightarrow\infty)$, $\lim\limits_{n\rightarrow\infty}\frac{1}{n}\sum^n_{i=1}h_i=0$, $\lim\limits_{n\rightarrow\infty}nh^4_n=\infty$;
(ⅱ) $\mbox{E}\theta=\int_\Theta\theta \mbox{d}G(\theta) < \infty$;
(ⅲ) $f^{(2)}(x)$为 $x$的连续函数;
则有 $\lim\limits_{n\rightarrow\infty}R_n=R_G.$
证 由引理3.2可知
其中 $A_n(x)=|\beta(x)|P(|\beta_n(x)-\beta(x)|\geq|\beta(x)|)$.易知 $0\leq A_n(x)\leq|\beta(x)|$.
由Fubini定理及 $\beta(x)$的表达式(1.4), 有
再由Lebesgue控制收敛定理得
所以要使定理3.1成立, 只要证明 $\lim\limits_{n\rightarrow\infty}A_n(x)=0$对a.s. $x$成立即可.
由(1.6) 式, (2.4) 式, Markov不等式及Jensen不等式, 得
再由引理3.1(a), 对任何固定的 $x\in\Omega$, 有
将(3.14) 式代入(3.13) 式可得定理结论, 定理3.1证毕.
定理3.2 设 $f^{(r)}_n(x)(r=0, 1)$由(2.5) 式定义, $R_n$, $R_G$分别由(2.7) 和(1.9) 式定义, 假定条件 $(A)$成立, 若对于 $0 < \lambda < 1$, 有
则当 $h_n=n^{-\frac{1}{2(s-1)}}$时, 有
证 由Markov不等式及引理3.2可知
其中 $\psi(x)=\lambda_0+x$.再根据引理3.1(b)及定理的条件得
将(3.16) 式和(3.17) 式代入(3.15) 式得
注2 由定理3.2结论可知, 当 $s$充分大且 $\lambda$任意接近1时, 参数 $\theta$的EB检验函数的收敛速度可任意接近 $\mbox{O}(n^{-\frac{1}{2}})$.
本节给出一个例子说明适合文中定理条件的Lomax分布和参数 $\theta$的先验分布族是存在的.
设给定 $\theta$时, 随机变量 $X$的分布为 $f(x|\theta)=\theta(1+x)^{-(1+\theta)}$, 此处 $\lambda_0=1$.设参数 $\theta$的先验分布族为
其中 $k=e^\beta$, $\beta>\frac{2\lambda}{1-\lambda}$, $0 < \lambda < 1$.经计算得
由(1.6) 式及(4.1)-(4.3) 式, 得
因此容易验证
(1) 由(4.1) 式知, $f(x)$关于 $x$的任意阶导数存在、连续且一致有界, 即 $f_G(x)\in C_{s, \beta}$, $s\geq4$为正整数;
(2) $\displaystyle\int_\Theta \theta \mbox{d} G(\theta)=k\int_\beta^{\infty}\theta e^{-\theta}\mbox{d}\theta\leq M\int_0^{\infty}\theta e^{-\theta}\mbox{d}\theta < \infty$;
(3) 因为 $\beta>\frac{2\lambda}{1-\lambda}$, 所以对于 $m=0, 1$, 都有 $(\beta+1)(1-\lambda)-m\lambda>1$, 于是由(4.4) 式和第一类广义积分的收敛判别法知,
因此由(1)-(3) 可知, 满足定理3.1和定理3.2条件的Lomax分布和参数 $\theta$的先验分布族是存在的.