Lomax分布极大似然估计的两点研究


扩展功能
	加入收藏夹

	复制引文信息

	加入引用管理器

	Email Alert

	RSS
本文作者相关文章
	李开灿

	刘大飞

	林存津

Lomax分布极大似然估计的两点研究

李开灿, 刘大飞, 林存津

湖北师范学院数学与统计学院, 湖北黄石 435002

收稿日期：2014-01-21; 接收日期：2014-09-10

基金项目：国家自然科学基金资助(10771175;11471105).

作者简介：李开灿(1962-),男,湖北武汉,教授,研究方向:多元统计分析

摘要：本文研究了Lomax分布参数极大似然估计的存在性和估计量的收敛性问题.利用严格的分析法和中心极限定理,获得了Lomax分布极大似然估计的存在性和估计量的渐近正态分布的结果,进一步推广到了有缺失数据的两个Lomax总体中,参数的极大似然估计有强相合性和渐近正态性.

关键词：Lomax分布极大似然估计渐近正态性

TWO RESEARCHES FOR THE MAXIMUM LIKELIHOOD ESTIMATION OF LOMAX DISTRIBUTION

LI Kai-can, LIU Da-fei, LIN Cun-jin

School of Mathematics and Statistics, Hubei Normal University, Huangshi 435002, China

Abstract: In this paper, we study the problems on existence and convergence of maximum likelihood estimation of parameters in Lomax distribution. Using a strict analysis method and the center limit theorem, we obtain some results that the maximum likelihood estimation of parameters in Lomax distribution exists, and the estimators are the asymptotic normal distribution. Further promoting to the situations in two Lomax populations with partially missing data, the maximum likelihood estimations possess the strong consistency and asymptotic normality.

Key words: Lomax distribution the maximum likelihood estimation asymptotic normality

1 引言

Lomax分布常常被人们称之为第二型的Pareto分布 (见文献[1]), 由于它包含了单调递增和单调递减的失效率, 从而在分析医学, 生物科学和工程科学等方面的寿命试验数据处理中起着重要的作用.近年来有许多文章研究这个分布的统计性质, 如文献[2]在特殊条件下研究了此分布参数估计的相合性, 渐近正态性和重对数律.文献[3-6]研究了各种损失下这个分布参数的Bayes估计的性质, 文献[7]研究了在NA样本下, 形状参数的经验Bayes检验问题.

实际上, Lomax分布的极大似然估计是否存在是一个重要的问题, 目前作者还没有发现文章正面回答了它, 本文在在Lomax分布存在的条件下, 用严格的分析方法给出了这个分布参数极大似然估计存在性的证明.另一方面象文献[8]介绍一样, 在两样本问题的研究中通常一个总体的观测值在观测者的控制之下, 而另一个总体不完全处于观测者的控制之下, 这样在抽样观测时, 缺失数据常常出现, 其中一种特殊形式即为每次观测时, 一个总体的观测值总是以一定概率被观测到, 文献[9-11]对具有部分缺失数据的两个指数总体, 泊松总体和几何总体的参数估计和检验问题进行了讨论, 用相似的方法, 对有部分缺失数据的两个Lomax总体给出参数估计及其统计性质研究是文章的第二个主题.

本文第二节给出了Lomax分布的概念和记号后, 证明了极大似然估计存在性和相关的收敛性, 在第三节给出了有部分缺失数据的两个Lomax总体的参数估计及其大样本性质.

2 Lomax分布参数极大似然估计的存在性和渐近性

本节主要给出Lomax分布参数极大似然估计存在性的证明, 然后简要描述极大似然估计的渐进正态性.为了记号的统一和描述的方便, 先给出Lomax分布的规定形式.

定义1 如果随机变量$X$的密度函数为

$f(x,{\theta},{\lambda}) =\frac{{\theta}{\lambda}^{{\theta}}}{({\lambda}+x)^{{\theta}+1}},x>0,$

(2.1)

其中${\lambda}$, ${\theta}>0$为常数, 那么称$X$服从参数为${\lambda}$, ${\theta}$的Lomax分布, ${\lambda}$称为尺度参数, ${\theta}$称为形状参数.

注易知当${\theta}>1$时, Lomax分布的期望

$E(X)=\frac{{\lambda}}{{\theta}-1},$

${\theta}>2$时, 其方差

${\rm Var}(X)=\frac{{\lambda}^{2}{\theta}}{({\theta}-1)^{2}({\theta}-2)}.$

引理1 设$a_{1},a_{2},{\cdots},a_{n}$是不等的正数, 那么

$(a_{1}+ a_{2}+{\cdots}+a_{n})(\frac{1}{a_{1}}+\frac{1}{a_{2}}+{\cdots}+\frac{1}{a_{n}})> n^{2},$

证明见文献[12] P. 122习题18.

定理1 设$X_{1},X_{2},{\cdots},X_{n}$为Lomax总体 (2.1) 的不相等的一组样本, 则Lomax分布的未知参数${\lambda},{\theta}$的存在极大似然估计.

证若$X_{1},X_{2},{\cdots},X_{n}$为Lomax总体的样本, 那么未知参数${\lambda},{\theta}$的似然函数为

$L(\theta ,\lambda ) = \prod\limits_{i = 1}^n f ({x_i};\theta ,\lambda ) = \frac{{{\theta ^n}{\lambda ^{n\theta }}}}{{\prod\limits_{i = 1}^n {{{(\lambda + {x_i})}^{\theta + 1}}} }}.$

对数似然函数是

$\ln L(\theta ,\lambda ) = n\ln \theta + n\theta \ln \lambda - (\theta + 1)\sum\limits_{i = 1}^n {\ln } (\lambda + {x_i}).$

从而似然方程为

$\frac{1}{\theta } + \ln \lambda - \frac{1}{n}\sum\limits_{i = 1}^n {\ln } (\lambda + {x_i}) = 0,\\ \frac{{n\theta }}{\lambda } - (\theta + 1)\sum\limits_{i = 1}^n {\frac{1}{{\lambda + {x_i}}}} = 0.$

将第二个方程的${\theta}$表示为${\lambda}$的函数有

$\frac{1}{{\theta}}=\frac{n-\sum\limits^{n}_{i=1}\frac{\lambda} {{\lambda}+x_{i}}}{\sum\limits^{n}_{i=1}\frac{\lambda}{{\lambda}+x_{i}}},$

代入第一个方程整理得

$(n - \sum\limits_{i = 1}^n {\frac{\lambda }{{\lambda + {x_i}}}} ) + \sum\limits_{i = 1}^n {\frac{\lambda }{{\lambda + {x_i}}}} \ln \frac{\lambda }{{\sqrt[n]{{(\lambda + {x_1})(\lambda + {x_2}) \cdots (\lambda + {x_n})}}}} = 0.$

令

$\varphi (\lambda ) = n - \sum\limits_{i = 1}^n {\frac{\lambda }{{\lambda + {x_i}}}} + \sum\limits_{i = 1}^n {\frac{\lambda }{{\lambda + {x_i}}}} \ln \frac{\lambda }{{\sqrt[n]{{(\lambda + {x_1})(\lambda + {x_2}) \cdots (\lambda + {x_n})}}}}, $

若$\varphi({\lambda})=0$有解, 从上述推导可知, 原似然方程组一定有解.

由于$\varphi(0+)=n>0$.另一方面, 记

$-\delta= \ln\frac{{\lambda}}{\sqrt[n]{({\lambda}+x_{1}) ({\lambda}+x_{2}){\cdots}({\lambda}+x_{n})}},$

则当

$\lambda\rightarrow +\infty, \quad \lambda \delta\rightarrow \overline{x},\quad\mbox{其中} \quad \overline{x}=\frac{\sum x_{i}}{n}.$

故$\lambda$充分大时,

$\varphi (\lambda ) \approx \sum\limits_{i = 1}^n {\frac{{{x_i}}}{{\lambda + {x_i}}}} - \sum\limits_{i = 1}^n {\frac{{\bar x}}{{\lambda + {x_i}}}} ,$

记$a_{i}=\lambda +x_{i}$, 则

$\varphi (\lambda ) \approx \frac{1}{n}({n^2} - \sum\limits_{i = 1}^n {{a_i}} \sum\limits_{i = 1}^n {\frac{1}{{{a_i}}}} ),$

由引理1, 当样本不相等, ${\lambda}$充分大时, $\varphi({\lambda})<0$, 并且$\varphi({\lambda}){\rightarrow}0$, 根据$\varphi({\lambda})$的连续性, $\varphi({\lambda})=0$有解.证毕.

在相应的正则条件下, Lomax分布中的未知参数极大似然估计也具有渐近正态性.事实上, 设$\hat{{\theta}}$与$\hat{{\lambda}}$分别是$\theta$和$\lambda$的极大似然估计, 则根据文献[13]定理4.9, 在适当的正则条件下, 当$n\rightarrow{\infty}$时,

$\sqrt{n}((\hat{{\theta}}-{\theta}),(\hat{{\lambda}}-{\lambda})) \stackrel{L}{\longrightarrow}N_{2}(0,(I)^{-1}),$

其中$I$是Fisher信息阵.对Lomax分布取对数

$\ln{f(x,{\theta},{\lambda})}=\ln{{\theta}}+{\theta}\ln{{\lambda}}-({\theta}+1)\ln{({\lambda}+x)},$

根据Fisher信息阵定义

$I=(I_{ij}),I_{ij}=-E_{{\theta}}[\frac{{\partial}^{2}\ln{f_{\theta}(x)}}{{\partial}{\theta}_{i}{\partial}{\theta}_{j}}].$

记$I_{ij}=-E[\frac{{\partial}^{2}{\ln}f(x,{\theta},{\lambda})}{{\partial}{\theta}{\partial}{\lambda}}],i,j=1,2$, 由于

$\frac{\partial^{2}\ln{f}}{\partial{\theta}^{2}}=-\frac{1}{{\theta}^{2}}, \frac{\partial^{2}\ln{f}}{\partial{\lambda}\partial{\theta}}=\frac{1}{{\lambda}}-\frac{1}{{\lambda}+x},\\ \frac{\partial^{2}\ln{f}}{\partial{\lambda}^{2}}=-\frac{{\theta}}{{\lambda}^{2}}+\frac{{\theta}}{({\lambda}+x)^{2}}+\frac{1}{({\lambda}+x)^{2}}.$

故有

$I_{11}=\frac{1}{{\theta}^{2}},I_{12}=-\frac{1}{{\lambda}({\theta}+1)},I_{22}=\frac{{\theta}}{{\lambda}^{2}({\theta}+2)}.$

于是

$I =\left(\begin{array}{ccc} {\frac{1}{{\theta}^{2}}}-\frac{1}{{\lambda}({\theta}+1)}\\ -\frac{1}{{\lambda}({\theta}+1)} \frac{{\theta}}{{\lambda}^{2}({\theta}+2)} \end{array}\right).$

从上述定理可知, Lomax分布未知参数极大似然估计可以用迭代算法得到数值解.

3 缺失数据下极大似然估计量的渐近性质

在对两个双参数Lomax分布总体的比较研究中, 如果一个总体的观测处于观测者的控制之下, 而另一个总体不完全处于观测者的控制之下, 那么为了检验两总体是否一致, 需要对原假设成立和对立假设成立下的两个总体分布的参数进行估计, 并获得大样本性质, 本节主要讨论这个问题.

为了能够确定其参数的极大似然估计以及渐近分布, 设Lomax分布密度函数中尺度参数${\lambda}$是已知的, 再令$Y=\ln{({\lambda}+X)}$, 利用变量转换得到包含原有参数的密度函数

$f(y,{\theta},{\lambda})={\theta}{\lambda}^{{\theta}}e^{-{\theta}y},y>\ln{\lambda}.$

由此设有两个Lomax总体的密度函数为

$f_{i}(x,{\theta}_{i},{\lambda})={\theta}_{i}{\lambda}^{{\theta}_{i}}e^{-{\theta}_{i}x},x>\ln{\lambda},$

其中$i=1,2.$ ${\theta}_{1},{\theta}_{2}$为形状参数.分别对两个总体进行n次独立观测, 其样本分别记为$Z=(Z_{1},Z_{2},\cdots,Z_{n})$, $Y=(Y_{1}, Y_{2},\cdots, Y_{n})$, 但在对第一个总体观测时, $Z_{i}$可能以$1-p$的概率丢失, 即实际上得到的观测值为$(Z_{i},{\delta}_{i}), j=1,2,\cdots,n$, 其中$({\delta}_{1},{\delta}_{2},\cdots,{\delta}_{n})$与$(Z_{1},Z_{2},\cdots,Z_{n})$独立, ${\delta}_{i}$独立同分布且

$P({\delta}_{i}=1)=p, P({\delta}_{i}=0)=1-p, i=1,2,\cdots,n.$

若${\delta}_{i}=1$, 则$Z_{i}$被观测到, 且$Z_{i}=X_{i}$; 若${\delta}_{i}=0$, 则$Z_{i}$未被观测到.记$n_{1}=\sum\limits^{n}_{j=1}{\delta}_{j},$它是一个随机变量, 服从成功概率为$p$的二项分布.它表示总体观测值的个数.若用$X_{1},X_{2},\cdots,X_{n_{1}}$表示总体的$n_{1}$个观测值, 则有

$\sum\limits^{n_{1}}_{j=1}X_{j}=\sum\limits^{n}_{j=1}Z_{j}{\delta}_{j}.$

在${\lambda}$已知的情形下, 为了比较两个总体的一致性, 常提出如下假设检验问题

$H_0: {\theta}_{1}={\theta}_{2}\quad \longleftrightarrow \quad H_1: {\theta}_{1}\neq{\theta}_{2}.$

在原假设成立时, 设${\theta}_{1}={\theta}_{2}={\theta}$(${\theta}$未知), 这时关于${\theta}$的观测似然为

$L(\theta ) = \prod\limits_{j = 1}^{{n_1}} \theta {\lambda ^\theta }{e^{ - \theta {x_j}}}\prod\limits_{j = 1}^n \theta {\lambda ^\theta }{e^{ - \theta {y_j}}} = {\theta ^{{n_1} + n}}{\lambda ^{({n_1} + n)\theta }}{e^{ - \theta (\sum\limits_{j = 1}^{{n_1}} {{x_j}} + \sum\limits_{j = 1}^n {{y_j}} )}}.$

由此解得的极大似然估计为

$\hat{{\theta}}= \frac{n_{1}+n}{(\sum\limits^{n_{1}}_{j=1}x_{j}+\sum\limits^{n}_{j=1}y_{j})-(n_{1}+n)\ln{\lambda}}.$

在对立假设成立时, 从观测值$X_{1},X_{2},\cdots,X_{n_{1}}$的似然函数可得${\theta}_{1}$的极大似然估计

$\hat{{\theta}_{1}}=\frac{n_{1}}{\sum\limits^{n_{1}}_{j=1}x_{j}-n_{1}\ln{{\lambda}}}= \frac{1}{\frac{1}{n_{1}}\sum\limits^{n_{1}}_{j=1}x_{j}-\ln{{\lambda}}}.$

为了证明这两个估计的收敛性, 先给出如下引理:

引理2 设$\{Z_{n}\}$为一随机变量序列, 且$Z_{n}\stackrel{\rm a.s.}{\longrightarrow}{c}$(常数), 又函数$g(\cdot)$在点$c$处连续, 则$g(Z_{n})\stackrel{\rm a.s.}{\longrightarrow}g(c)$.这个证明用定义立即可得.

引理3 设$\{a_{n}\}$为一趋于${\infty}$的数列, $b$为常数, 并且对随机变量序列$\{Z_{n}\}$有$a_{n}(Z_{n}-b)\stackrel{L}{\longrightarrow}{Z}$, 又设$g'(\cdot)$在点$b$处连续, 则有

$a_{n}[g(Z_{n})-g(b)]\stackrel{L}{\longrightarrow}{g'(b)Z}.$

证明见文献[14].

现在分别给出$\hat{{\theta}_{1}}$与$\hat{{\theta}}$的强相合性与渐近正态性.

定理2 ${\hat{{\theta}_{1}}}\longrightarrow{{\theta}_{1}}$ a.s., $\sqrt{n}({\hat{{\theta}_{1}}}-{\theta}_{1})\stackrel{L}{\longrightarrow}{N(0,\frac{{\theta}^{2}_{1}}{p})}$.

证由强大数定律可知

$\frac{{{n_1}}}{n} = \frac{1}{n}\sum\limits_{j = 1}^n {{\delta _j}} \longrightarrow E{\delta _1} = p{\rm{a}}.{\rm{s}}.,\\ \frac{1}{n}\sum\limits_{j = 1}^n {{Z_j}} {\delta _j} \longrightarrow E{Z_1}E{\delta _1} = (\ln \lambda + \frac{1}{{{\theta _1}}})p{\rm{a}}.{\rm{s}}..$

令$t=\frac{1}{n_{1}}\sum\limits^{n_{1}}_{j=1}X_{j}$, 则有函数$f(t)=\frac{1}{t-\ln{\lambda}}$在$\ln{\lambda}+\frac{1}{{\theta}_{1}}$处连续, 并且有$f(\ln{\lambda}+\frac{1}{{\theta}_{1}})={\theta}_{1}$.

$t = \frac{1}{{{n_1}}}\sum\limits_{j = 1}^{{n_1}} {{X_j}} = \frac{n}{{{n_1}}} \cdot \frac{1}{n}\sum\limits_{j = 1}^{{n_1}} {{X_j}} = \frac{n}{{{n_1}}} \cdot \frac{1}{n}\sum\limits_{j = 1}^n {{Z_j}} {\delta _j} \longrightarrow \ln \lambda + \frac{1}{{{\theta _1}}}{\rm{a}}.{\rm{s}}..$

于是由引理2可得

$\begin{array}{l} \widehat {{\theta _1}} = f(\frac{1}{{{n_1}}}\sum\limits_{j = 1}^{{n_1}} {{X_j}} ) \longrightarrow f(\ln \lambda + \frac{1}{{{\theta _1}}}) = {\theta _1}{\rm{a}}.{\rm{s}}.,\\ \sqrt n (\frac{1}{{{n_1}}}\sum\limits_{j = 1}^{{n_1}} {{X_j}} - (\ln \lambda + \frac{1}{{{\theta _1}}}))\\ = \sqrt n [\frac{1}{{{n_1}}}\sum\limits_{j = 1}^{{n_1}} {({X_j} - (} \ln \lambda + \frac{1}{{{\theta _1}}}))]\\ = \sqrt n \cdot \frac{n}{{{n_1}}} \cdot \frac{1}{n}[\sum\limits_{j = 1}^n {({Z_j} - (} \ln \lambda + \frac{1}{{{\theta _1}}})){\delta _j}]\\ = \sqrt n (\frac{n}{{{n_1}}} - \frac{1}{p})\frac{1}{n}[\sum\limits_{j = 1}^n {({Z_j} - (} \ln \lambda + \frac{1}{{{\theta _1}}})){\delta _j}] + \frac{1}{p} \cdot \frac{1}{{\sqrt n }}[\sum\limits_{j = 1}^n {({Z_j} - (} \ln \lambda + \frac{1}{{{\theta _1}}})){\delta _j}]\\ \stackrel{\triangle}{=}{I_1} + {I_2}. \end{array}$

由$\frac{n}{n_{1}}-\frac{1}{p}\longrightarrow{0} {\rm a.s.}$, 利用Slutsky定理可知$I_{1}\stackrel{L}{\longrightarrow}{0}.$根据中心极限定理有

$\frac{1}{{\sqrt n }}[\sum\limits_{j = 1}^n {({Z_j} - (} \ln \lambda + \frac{1}{{{\theta _1}}})){\delta _j}]\mathop \longrightarrow \limits^L N(0,\frac{1}{{\theta _1^2}}p).$

其中

$E(Z_{j}-(\ln{\lambda}+\frac{1}{{\theta}_{1}})){\delta}_{j} =E(Z_{j}-(\ln{\lambda}+\frac{1}{{\theta}_{1}}))E{\delta}_{j}=0,\\ D(Z_{j}-(\ln{\lambda}+\frac{1}{{\theta}_{1}})){\delta}_{j} =E[(Z_{j}-(\ln{\lambda}+\frac{1}{{\theta}_{1}})){\delta}_{j}]^{2}-[E(Z_{j}- (\ln{\lambda}+\frac{1}{{\theta}_{1}})){\delta}_{j}]^{2}=\frac{1}{{\theta}^{2}_{1}}p.$

于是有$I_{2}=\frac{1}{p}\cdot\frac{1}{\sqrt{n}} [\sum\limits^{n}_{j=1}(Z_{j}-(\ln{\lambda}+\frac{1}{{\theta}_{1}})){\delta}_{j}] \stackrel{L}{\longrightarrow}{N(0,\frac{1}{p{\theta}^{2}_{1}})}$.即

$\sqrt n (\frac{1}{{{n_1}}}\sum\limits_{j = 1}^{{n_1}} {{X_j}} - (\ln \lambda + \frac{1}{{{\theta _1}}}))\mathop \longrightarrow \limits^L N(0,\frac{1}{{p\theta _1^2}}).$

又$f'(t)=-\frac{1}{(t-\ln{\lambda})^{2}}$在$\ln{\lambda}+\frac{1}{{\theta}_{1}}$处是连续的, $f'(\ln{\lambda}+\frac{1}{{\theta}_{1}})=-{\theta}^{2}_{1}$.由引理3可知

$\sqrt n (\widehat {{\theta _1}} - {\theta _1}) = \sqrt n (f(\frac{1}{{{n_1}}}\sum\limits_{j = 1}^{{n_1}} {{X_j}} ) - f(\ln \lambda + \frac{1}{{{\theta _1}}}))\mathop \longrightarrow \limits^L N(0,\frac{{\theta _1^2}}{p}). $

证毕.

利用本定理的证明方法完全一样的可以证明如下定理3.

定理3 ${\hat{{\theta}}}\longrightarrow{{\theta}}$ a.s., $\sqrt{n}({\hat{{\theta}}}-{\theta}) \stackrel{L}{\longrightarrow}{N(0,\frac{{\theta}^{2}}{p+1})}$.

有了这些结果我们可以用文献[9, 11]的方法对Lomax分布进行假设检验的讨论, 鉴于手法的一致性, 为了节省篇幅, 这里不再赘述.

本文尽管对完全数据下, Lomax分布两参数极大似然估计的存在性给出了证明, 对其数值解算法的优良性还有待进一步研究.

参考文献

[1]	姚惠, 谢林. 不同损失下 Lomax 分布形状参数的 Bayes 估计[J]. 数学杂志, 2011, 31(6): 1131–1135.

[2]	吴其平. 最大似然估计的相合性、渐近正态性及重对数律[J]. 福州大学学报(自然科学版), 1996, 24(05): 8–13.

[3]	周明元. 对称熵损失函数下两参数 Lomax 分布形状参数的 Bayes 估计[J]. 统计与决策, 2010, 17: 8–10.

[4]	肖小英, 任海平. 熵损失函数下两参数 Lomax 分布形状参数的 Bayes 估计[J]. 数学的实践与认识, 2010, 40(05): 227–230.

[5]	姚惠. Linex 损失下 Lomax 分布形状参数的 Bayes 估计[J]. 统计与决策, 2011, 16: 173–175.

[6]	龙兵. 两参数 Lomax 分布次序统计量的性质与渐近分布[J]. 兰州交通大学学报, 2013, 32(4): 36–40.

[7]	王琪, 任海平. NA 样本下两参数 Lomax 分布形状参数的经验 Bayes 检验[J]. 统计与决策, 2010, 12: 161–162.

[8]	马明月, 宋立新. 具有部分缺失数据两个双参数指数总体的估计[J]. 吉林师范大学学报, 2004, 2: 14–18. DOI:10.3969/j.issn.1007-5674.2004.06.003

[9]	刘银萍. 具有部分缺失数据时两个 Poisson 总体的估计和检验[J]. 工科数学, 2002, 19(12): 82–86.

[10]	朱五英. 具有部分缺失数据两个几何分布总体的估计[J]. 安徽师范大学学报, 2008, 31(1): 13–15.

[11]	苏曦, 郭鹏江, 夏志明. 两个总体服从指数有缺失数据的参数估计和检验[J]. 三峡大学学报(自然科学版), 2011, 33(4): 101–103.

[12]	徐利治, 王兴华. 数学分析的方法及例题选讲[M]. 北京: 高等教育出版社, 1985.

[13]	陈希儒. 高等数理统计学[M]. 合肥: 中国科技大学出版社, 1999.

[14]	茆诗松, 王静龙, 濮晓龙. 高等数理统计(第二版.)[M]. 北京: 高等教育出版社, 2006.