Lomax分布常常被人们称之为第二型的Pareto分布 (见文献[1]), 由于它包含了单调递增和单调递减的失效率, 从而在分析医学, 生物科学和工程科学等方面的寿命试验数据处理中起着重要的作用.近年来有许多文章研究这个分布的统计性质, 如文献[2]在特殊条件下研究了此分布参数估计的相合性, 渐近正态性和重对数律.文献[3-6]研究了各种损失下这个分布参数的Bayes估计的性质, 文献[7]研究了在NA样本下, 形状参数的经验Bayes检验问题.
实际上, Lomax分布的极大似然估计是否存在是一个重要的问题, 目前作者还没有发现文章正面回答了它, 本文在在Lomax分布存在的条件下, 用严格的分析方法给出了这个分布参数极大似然估计存在性的证明.另一方面象文献[8]介绍一样, 在两样本问题的研究中通常一个总体的观测值在观测者的控制之下, 而另一个总体不完全处于观测者的控制之下, 这样在抽样观测时, 缺失数据常常出现, 其中一种特殊形式即为每次观测时, 一个总体的观测值总是以一定概率被观测到, 文献[9-11]对具有部分缺失数据的两个指数总体, 泊松总体和几何总体的参数估计和检验问题进行了讨论, 用相似的方法, 对有部分缺失数据的两个Lomax总体给出参数估计及其统计性质研究是文章的第二个主题.
本文第二节给出了Lomax分布的概念和记号后, 证明了极大似然估计存在性和相关的收敛性, 在第三节给出了有部分缺失数据的两个Lomax总体的参数估计及其大样本性质.
本节主要给出Lomax分布参数极大似然估计存在性的证明, 然后简要描述极大似然估计的渐进正态性.为了记号的统一和描述的方便, 先给出Lomax分布的规定形式.
定义1 如果随机变量$X$的密度函数为
其中${\lambda}$, ${\theta}>0$为常数, 那么称$X$服从参数为${\lambda}$, ${\theta}$的Lomax分布, ${\lambda}$称为尺度参数, ${\theta}$称为形状参数.
注 易知当${\theta}>1$时, Lomax分布的期望
${\theta}>2$时, 其方差
引理1 设$a_{1},a_{2},{\cdots},a_{n}$是不等的正数, 那么
证明见文献[12] P. 122习题18.
定理1 设$X_{1},X_{2},{\cdots},X_{n}$为Lomax总体 (2.1) 的不相等的一组样本, 则Lomax分布的未知参数${\lambda},{\theta}$的存在极大似然估计.
证 若$X_{1},X_{2},{\cdots},X_{n}$为Lomax总体的样本, 那么未知参数${\lambda},{\theta}$的似然函数为
对数似然函数是
从而似然方程为
将第二个方程的${\theta}$表示为${\lambda}$的函数有
代入第一个方程整理得
令
若$\varphi({\lambda})=0$有解, 从上述推导可知, 原似然方程组一定有解.
由于$\varphi(0+)=n>0$.另一方面, 记
则当
故$\lambda$充分大时,
记$a_{i}=\lambda +x_{i}$, 则
由引理1, 当样本不相等, ${\lambda}$充分大时, $\varphi({\lambda})<0$, 并且$\varphi({\lambda}){\rightarrow}0$, 根据$\varphi({\lambda})$的连续性, $\varphi({\lambda})=0$有解.证毕.
在相应的正则条件下, Lomax分布中的未知参数极大似然估计也具有渐近正态性.事实上, 设$\hat{{\theta}}$与$\hat{{\lambda}}$分别是$\theta$和$\lambda$的极大似然估计, 则根据文献[13]定理4.9, 在适当的正则条件下, 当$n\rightarrow{\infty}$时,
其中$I$是Fisher信息阵.对Lomax分布取对数
根据Fisher信息阵定义
记$I_{ij}=-E[\frac{{\partial}^{2}{\ln}f(x,{\theta},{\lambda})}{{\partial}{\theta}{\partial}{\lambda}}],i,j=1,2$, 由于
故有
于是
从上述定理可知, Lomax分布未知参数极大似然估计可以用迭代算法得到数值解.
在对两个双参数Lomax分布总体的比较研究中, 如果一个总体的观测处于观测者的控制之下, 而另一个总体不完全处于观测者的控制之下, 那么为了检验两总体是否一致, 需要对原假设成立和对立假设成立下的两个总体分布的参数进行估计, 并获得大样本性质, 本节主要讨论这个问题.
为了能够确定其参数的极大似然估计以及渐近分布, 设Lomax分布密度函数中尺度参数${\lambda}$是已知的, 再令$Y=\ln{({\lambda}+X)}$, 利用变量转换得到包含原有参数的密度函数
由此设有两个Lomax总体的密度函数为
其中$i=1,2.$ ${\theta}_{1},{\theta}_{2}$为形状参数.分别对两个总体进行n次独立观测, 其样本分别记为$Z=(Z_{1},Z_{2},\cdots,Z_{n})$, $Y=(Y_{1}, Y_{2},\cdots, Y_{n})$, 但在对第一个总体观测时, $Z_{i}$可能以$1-p$的概率丢失, 即实际上得到的观测值为$(Z_{i},{\delta}_{i}), j=1,2,\cdots,n$, 其中$({\delta}_{1},{\delta}_{2},\cdots,{\delta}_{n})$与$(Z_{1},Z_{2},\cdots,Z_{n})$独立, ${\delta}_{i}$独立同分布且
若${\delta}_{i}=1$, 则$Z_{i}$被观测到, 且$Z_{i}=X_{i}$; 若${\delta}_{i}=0$, 则$Z_{i}$未被观测到.记$n_{1}=\sum\limits^{n}_{j=1}{\delta}_{j},$它是一个随机变量, 服从成功概率为$p$的二项分布.它表示总体观测值的个数.若用$X_{1},X_{2},\cdots,X_{n_{1}}$表示总体的$n_{1}$个观测值, 则有
在${\lambda}$已知的情形下, 为了比较两个总体的一致性, 常提出如下假设检验问题
在原假设成立时, 设${\theta}_{1}={\theta}_{2}={\theta}$(${\theta}$未知), 这时关于${\theta}$的观测似然为
由此解得的极大似然估计为
在对立假设成立时, 从观测值$X_{1},X_{2},\cdots,X_{n_{1}}$的似然函数可得${\theta}_{1}$的极大似然估计
为了证明这两个估计的收敛性, 先给出如下引理:
引理2 设$\{Z_{n}\}$为一随机变量序列, 且$Z_{n}\stackrel{\rm a.s.}{\longrightarrow}{c}$(常数), 又函数$g(\cdot)$在点$c$处连续, 则$g(Z_{n})\stackrel{\rm a.s.}{\longrightarrow}g(c)$.这个证明用定义立即可得.
引理3 设$\{a_{n}\}$为一趋于${\infty}$的数列, $b$为常数, 并且对随机变量序列$\{Z_{n}\}$有$a_{n}(Z_{n}-b)\stackrel{L}{\longrightarrow}{Z}$, 又设$g'(\cdot)$在点$b$处连续, 则有
证明见文献[14].
现在分别给出$\hat{{\theta}_{1}}$与$\hat{{\theta}}$的强相合性与渐近正态性.
定理2 ${\hat{{\theta}_{1}}}\longrightarrow{{\theta}_{1}}$ a.s., $\sqrt{n}({\hat{{\theta}_{1}}}-{\theta}_{1})\stackrel{L}{\longrightarrow}{N(0,\frac{{\theta}^{2}_{1}}{p})}$.
证 由强大数定律可知
令$t=\frac{1}{n_{1}}\sum\limits^{n_{1}}_{j=1}X_{j}$, 则有函数$f(t)=\frac{1}{t-\ln{\lambda}}$在$\ln{\lambda}+\frac{1}{{\theta}_{1}}$处连续, 并且有$f(\ln{\lambda}+\frac{1}{{\theta}_{1}})={\theta}_{1}$.
于是由引理2可得
由$\frac{n}{n_{1}}-\frac{1}{p}\longrightarrow{0} {\rm a.s.}$, 利用Slutsky定理可知$I_{1}\stackrel{L}{\longrightarrow}{0}.$根据中心极限定理有
其中
于是有$I_{2}=\frac{1}{p}\cdot\frac{1}{\sqrt{n}} [\sum\limits^{n}_{j=1}(Z_{j}-(\ln{\lambda}+\frac{1}{{\theta}_{1}})){\delta}_{j}] \stackrel{L}{\longrightarrow}{N(0,\frac{1}{p{\theta}^{2}_{1}})}$.即
又$f'(t)=-\frac{1}{(t-\ln{\lambda})^{2}}$在$\ln{\lambda}+\frac{1}{{\theta}_{1}}$处是连续的, $f'(\ln{\lambda}+\frac{1}{{\theta}_{1}})=-{\theta}^{2}_{1}$.由引理3可知
证毕.
利用本定理的证明方法完全一样的可以证明如下定理3.
定理3 ${\hat{{\theta}}}\longrightarrow{{\theta}}$ a.s., $\sqrt{n}({\hat{{\theta}}}-{\theta}) \stackrel{L}{\longrightarrow}{N(0,\frac{{\theta}^{2}}{p+1})}$.
有了这些结果我们可以用文献[9, 11]的方法对Lomax分布进行假设检验的讨论, 鉴于手法的一致性, 为了节省篇幅, 这里不再赘述.
本文尽管对完全数据下, Lomax分布两参数极大似然估计的存在性给出了证明, 对其数值解算法的优良性还有待进一步研究.