经验Bayes(EB)检验函数问题在文献中已有许多研究, 对于连续型单参数指数族参数的EB检验问题, 如Johns VR[1], Van Houwelingen[2], Liang[3]等对其做了不同程度的工作, 魏莉等[4]研究了刻度指数族参数的经验Bayes检验的收敛速度, 陈玲等[5]研究了连续单参数指数参数的经验Bayes检验的收敛速度, 黄金超等[6]在“线性损失”下利用普通核估计研究了威布尔(Weibull)分布族刻度参数的经验Bayes检验问题, 在适当的条件下获得的收敛速度的阶可任意接近 $O(n^{-\frac{1}{2}})$, 但以上几乎所有研究EB检验问题的文献中, 都是利用密度函数的普通核估计来研究的, 与以上文献主要不同, 本文利用递归核估计构造威布尔(Weibull)分布族刻度参数的经验Bayes检验函数, 并在“加权线性损失”下利用密度函数的递归核估计和Bayes检验函数的单调性, 修改EB检验函数的构造方法, 在较弱的条件下极大改进了文献[6]的收敛速度阶的结果, 在适当的条件下收敛速度的阶可任意接近 $O(n^{-1})$, 且证明方法较简洁.
考虑如下模型见文献[6]; 设随机变量 $X$条件概率密度为
其中 $m$和 $\theta$分别为形状参数和刻度参数( $m$>0), 且本文假定 $m$为已知常数, 样本空间为 $\chi=\{x|x>0\}$, 参数空间为 $\Omega=\{\theta|\theta>0\}$.
本文考虑分布族(1.1) 式中参数 $\theta$的EB检验问题:
其中 $\theta_{0}>0$为已知常数.
对检验函数(1.2) 式损失函数为下列的“加权线性损失”
其中 $a$是正常数, $D=\{d_{0}, ~d_{1}\}$是行动空间, $d_{0}$表示接受 $H_{0}$, $d_{1}$表示否定 $H_{0}$, $I_{[A]} $表示集合 $A$的示性函数, 之所以取“加权线性损失”函数是考虑到它对刻度参数更为合理, 易于构造其EB检验函数.
设
为随机化判别函数, 则在先验分布 $G(\theta)$下 $\delta(x)$的风险函数为
此处
其中
为r.v.X的边缘分布, 而 $u(x)=mx^{m-1}, ~ p(x)=\int_{\Omega}\theta^{-1}\exp(-x^{m}/\theta)dG(\theta), $
由(1.6) 式和(1.7) 式 $\alpha(x)$的另一表达式
其中 $g(x)=1-\theta_{0}\frac{u^{(1)}(x)}{u^{(2)}(x)}$, $u(x)$由(1.7) 式给出
由柯西—施瓦茨(Cauchy-Schwarz)不等式和(1.8) 式可得
所以对 $0<x<+\infty$, $\varphi(x)$是单调连续减函数.
本文假设先验 $G(\theta)$是非退化的且满足
在假定(1.11) 式成立下, 故 $\varphi(x)$是严格单调降的, 再由 $\varphi(x)$的连续性和连续函数的介值定理可知必存在点 $a_{G}\in(0, +\infty)$, 使得 $\varphi(a_{G})=\theta^{-1}_{0}$.又由(1.9) 式可知
因此由(1.5) 式可知Bayes判决函数为
其Bayes风险为
在(1.13) 式中, 当先验分布 $G(\theta)$已知, 且 $\delta(x)=\delta_{G}(x)$是可以达到的, 但此处 $G(\theta)$未知, 因而 $\delta_{G}(x)$无使用价值, 于是考虑引入EB方法.
本文第二节利用概率密度函数递归核估计和Bayes检验函数的单调性, 给出EB检验函数的构造法, 对文献[6]中的检验函数做了本质的修改.第三节在独立同分布条件下, 证明Bayes检验函数的收敛速度, 这一收敛速度改进文献[6]的结果.最后给出满足定理条件的先验分布是存在的.
设 $X_{1}, X_{2}, \cdots, X_{n}$和 $X$是独立同分布样本(iid), 它们具有共同的边缘密度函数如(1.7) 式所示, 通常称 $X_{1}, X_{2}, \cdots, X_{n}$为历史样本, 称 $X$为当前样本, 令 $f(x)$为 $X_{1}$的概率密度函数, 同分布样本(iid)作如下假定:
(A) $f(x)\in C_{s, a}$.
假定 $C_{s, a}$表示 $R^{1}$中一族概率密度函数, 其 $s$阶导数存在, 连续且绝对值不超过 $\alpha$, $s>2$为正整数.
令 $K_{r}(x)(r=0, 1, 2, \cdots, s-1)$是Borel可测的有界函数, 在区间(0, 1) 之外为零, 且满足下列的条件(B):
(B $_{1})~~~ \frac{1}{t!}\int^{1}_{0}y^{t}K_{r}(y)dy= \left\{ \begin{array}{ll} 1, &t=r, \\ 0, &t\neq r, t=1, 2, \cdots, s-1. \end{array} \right.$
(B $_{2})~~~ K_{r}(x)$在 $R^{1}$上除有限点集 $E_{0}$外是可微的, 且
本文假定先验分布 $G(\theta)$非退化, 且属于下列先验分布类:
(C) $ \Gamma{(A_{1}, A_{2})}=\{G(\theta)|A_{1}<a_{G}<A_{2}, ~ A_{1}, A_{2}$为给定的正常数},
通常取 $A_{1}$为充分小正数, $A_{2}$为充分大正数.
记 $f^{(0)}(x)=f(x)$, $f^{(r)}(x)$表示 $f(x)$的第 $r$阶导数, $r=0, 1, \cdots, s.$类似文献[7]定义密度函数 $f^{(r)}(x)$的递归核估计为
其中为 $\{h_{n}\}$正数递减序列, 且 $\mathop {\lim }\limits_{n \to \infty } {h_n} = 0$是满足条件(B)的核函数, 这种估计具有一种递归性质, 即
由上式递推关系可知, 用递归核估计去估计 $f^{(r)}(x)$时, 只需通过上式进行递归计算, 即在样本点増加地情形下,不需要重新计算每一项, 仅计算新的添加项, 而用普通的核估计的话需要重新计算每一项, 所以可以大大减少计算量.另外, 递归核估计在不同区间能取不同的适当窗宽, 从而克服了核估计的过分平滑和过分锐化, 能够较全面地描述密度函数, 因此大大地提高了估计的效率.
定义 $\alpha(x)$的估计量由下式给出
由先验假设(C)给出的 $A_{1}, A_{2}$, 结合(1.12) 式, EB检验函数定义为
EB检验这样的构造方法最先由文献[8]对正指数分布族提出来的.
本文中令 $E_{n}$表示对r.v. $X_{1}, X_{2}, \cdots, X_{n}$的联合分布求均值, 则的全面Bayes风险为
若 $\mathop {\lim }\limits_{n \to \infty } {R_n} = R(G), $则称 $\{\delta_{n}(x)\}$为a.o.的EB检验函数, $R_{n}-R(G)=O(n^{-q}), q>0, $则称EB检验函数 $\{\delta_{n}(x)\}$的收敛速度阶为 $O(n^{-q})$, 为导出 $\delta_{n}$的收敛速度, 我们给出下述引理.
令 $c, c_{0}, c_{1}, c_{2}, \cdots$表示常数, 即使在同一式子中它们也可能不同的数值.
引理2.1 设 $f^{(r)}_{n}(x)$由(2.1) 式定义, $s\geq3$的正整数, 其中 $X_{1}, X_{2}, \cdots, X_{n}$为独立同分布(iid)样本序列, 若条件(A)和(B)成立且 $f^{(r)}_{n}(x)$连续, $h_{n}\downarrow0$当取 $h_{n}=n^{-\frac{1}{2(s-1)}}$时, 对 $0<\lambda\leq1$, 则有
证 由 $C_{r}$不等式可知, 对 $r=0, 1$有
由递归函数的核估计和核函数的性质, 可知
由Taylor展开得
将(2.7) 式代入(2.6) 式, 可得
由 $f(x)\in C_{s, a}$, 及 $|K_{r}(t)|\leq C, $可知
再由 $f(x)\in C_{s, a}$, 及 $|K_{r}(t)|\leq C$, $h_{n}$单调递减 $\mathop {\lim }\limits_{n \to \infty } {h_n} = 0$可知
取 $h_{i}=i^{-\frac{1}{2(s-1)}}$时, 可知
由(2.9) 式, 可得
故有
由(2.10) 式, 取 $h_{n}=n^{-\frac{1}{2(s-1)}}$时, 有
将(2.11) 式和(2.12) 式代入(2.5) 式, 结论成立.
注2.1 当 $\lambda\longrightarrow1, s\longrightarrow\infty$时, $O(n^{-\frac{\lambda(s-r-1.5)}{s-1}})$可任意接近 $O(n^{-1})$.
定理3.1 设 $\delta_{n}(x)$由(2.3) 式定义, 其中 $X_{1}, X_{2}, \cdots, X_{n}$为独立同分布的样本序列.且假定 $(A)-(C)$成立, 且 $f^{(r)}_{n}(x)$连续, $h_{n}\downarrow 0$, 若 $0<\lambda\leq 1, ~$取 $h_{n}=n^{-\frac{1}{2(s-1)}}$时, 则有
此处 $s>2$为给定的一个正整数.
证 由(1.13) 式和(2.4) 式, 可知
由(1.9) 式和(2.2) 式, $C_{r}$不等式与引理2.1可知
其中 $g(x)$和 $u(x)$分别(1.7) 式和(1.9) 式给出.
当 $x\in(0, A_{1})$时, 由(1.12) 式和(2.3) 式可知 $\delta_{n}(x)=1, ~\delta_{G}(x)=1, ~x\in(A_{2}, \infty)$时, $\delta_{n}(x)=0, ~\delta_{G}(x)=0$.故
因此
当 $x\in(A_{1}, a_{G})$时, 由(1.12) 式和(2.3) 式可知, $\delta_{G}(x)=1, ~E_{n}\delta_{n}(x)=p(\alpha_{n}(x)<0)$, 利用Markov不等式和(3.2) 式有
当 $0<\lambda\leq -\frac{1}{2}$时, $0\leq1-2\lambda <1$, 且 $|\alpha(x)|^{1-2\lambda}$, $|u(x)|^{-2\lambda}$和 $|g(x)|^{2\lambda}$关于 $x$在闭区间 $[A_{1}, a_{G}]$上连续函数, 由闭区间上连续函数的有界性知,
当 $\frac{1}{2} < \lambda\leq1$时,
且
是第2类瑕积分, 瑕点为 $x=a_{G}$, 由(1.8) 式, (1.10) 式和第2类瑕积分的比较判别法则, 可知
$\displaystyle\int^{a_{G}}_{A_{1}}\frac{1}{|\alpha(x)|^{2\lambda-1}}dx$与 $\displaystyle\int^{a_{G}}_{A_{1}}\frac{1}{(a_{G}-x)^{2\lambda-1}}dx$同敛散, 因为 $\frac{1}{2} < \lambda\leq1$时, $\displaystyle\int^{a_{G}}_{A_{1}}\frac{1}{(a_{G}-x)^{2\lambda-1}}dx$是收敛的, 因此 $\displaystyle\int^{a_{G}}_{A_{1}}|\alpha(x)|^{1-2\lambda}dx$收敛, $\frac{1}{u(x)}$, $\frac{u^{(1)}(x)}{u^{(2)}(x)}$均为闭区间 $[A_{1}, a_{G}]$连续函数, 故连续函数有界性知 $|u(x)|^{-2\lambda}\leq M_{1}$, $|g(x)|^{2\lambda}\leq M_{2}$, 故
同理可证
所以将(3.3)-(3.6) 式代入(3.1) 式可得
注3.1 文献[6]在iid样本下给出的经验Bayes(EB)检验函数, 收敛速度阶为 $O(n^{-\frac{\lambda s}{2s+1}})$, 其中 $0<\lambda \leq1, ~ s\geq2, ~\lambda \longrightarrow 1, s\longrightarrow \infty$, 收敛速度的阶可任意接近 $O(n^{-\frac{1}{2}})$.本文在iid样本下利用递归核估计和EB检验函数的单调性, 构造EB检验函数, 得到收敛速度的阶为 $O(n^{-\frac{\lambda(s-2.5)}{s-1}})$, 其中 $0<\lambda \leq1, ~s\geq3, ~\lambda \longrightarrow 1, ~s\longrightarrow \infty$, 收敛速度的阶可任意接近 $O(n^{-1})$.比文献[6]中的收敛速度的阶快了约1倍, 极大改进文献[6]中的结果, 但是采用核估计和构造方法不一样, 本文方法较简洁些.
下面举例说明适合文中定理条件的Weibull族和先验分布是存在的, 在模型(1.1) 式中, 令 $m$为给定已知正整数, 其中取 $\theta$的先验分布为
$a$和 $b$为已知常数 $a>0, b>0$, 所以有
由(4.2) 式易见 $f(x)$为 $x$任意阶可导函数, 导函数连续, 一致有界, 即 $f(x)\in C_{s, a}$, 条件(A)成立, 在假定iid样本下所加条件(B)成立, 因此只需验证条件(C)成立即可,
$\varphi^{\prime}(x)=-\frac{b+1}{(x^{m}+a)^{2}}mx^{m-1}\leq 0$, 故 $\varphi(x)$在 $x>0$时单调递减,
不妨假设 $A_{1}=10^{-8}, ~A _{2}=10^{8}, ~\theta_{0}(b+1)\geq a, ~$因为
所以
有
即假设条件(C)也成立, 故定理3.1结论成立.