在研究线性回归模型时, 往往直接或间接地假设误差服从正态分布, 取得了大量令人满意的结果(参见文献[1-2]). 但在很多情况下, 误差并不服从正态分布, 由此将会产生一些用正态分布无法解决的问题. 由于P-范分布包含拉普拉斯分布、正态分布、均匀分布、退化分布等在内的一类重要分布, 在某些情况下(如地图数字化误差)它比正态分布更适合描述误差分布. 另外, 在常用的估计最小准则下, 参数的估值与总体服从P-范分布时的极大似然估值一致(参见文献[3]). 基于这些, 越来越多的人研究P-范分布及其相关问题, 如: 文献[3]研究了P-范分布及其抽样分布; 文献[4]系统地研究了P- 范分布理论及其在现代测量数据处理中的应用; 文献[5]对P-范分布参数的估计方法进行了改进, 建立了P-范分布的参数估计的实数阶矩估计方法; 文献[6]用P- 范分布对上证指数的日收益率进行拟合, 得到较好的结果. 似然比方法是一种应用很广泛的检验方法, 深入的结果有很多, 如: 文献[7]用似然比方法对线性混合模型的方差参数进行了检验; 文献[8]运用Skovgaard's修正似然比方法研究指数族非线性模型, 得到了修正似然比统计量近似服从分布; 文献[9]讨论了高维正态向量独立性的假设检验问题, 得到了似然比统计量的极限分布. 文献[10]用Lq似然比方法对广义极值分布的形状参数进行了检验; 文献[11]针对一般的污染分布提出了具有稳健性的Lq似然比检验, 得到了Lq似然比检验统计量的渐近分布; 文献[12]提出了基于似然比检验的二阶段多项式曲线控制图, 并通过平均运行长度来衡量控制图的性能表现.
尽管研究P-范分布和运用似然比检验方法的成果很多, 但是运用似然比方法对P-范分布中的参数进行检验的文献甚少. 为此, 本文用似然比方法对P-范分布中尺度参数的检验进行了研究.
本节简要介绍P-范分布及其抽样分布, 详细内容请参见文献[3-4].
定义2.1 若随机变量$ X $的密度函数为
则称$ X $服从一元P-范分布(其中$ \lambda=(\Gamma(3/p)/\Gamma(1/p))^{1/2} $, 位置参数为$ \mu $, 尺度参数为$ \sigma>0) $.
注 易知拉普拉斯分布(令$ p=1 $)、正态分布(令$ p=2 $)、均匀分布(令$ p\rightarrow \infty $) 与退化分布(令$ p\rightarrow0 $)均为一元P-范分布(2.1)的特例. 由此可知, P- 范分布揭示了表面上毫不相关的几个分布的内在本质联系.
定义2.2 设随机变量$ X_1, X_2, \cdots, X_n $独立同分布, 服从$ \mu=0 $、$ \sigma=1 $的一维P-范分布, 则称随机变量$ Y= \sum\limits_{i=1}^n|X_i|^p $服从自由度为$ n $的$ \chi^p $分布, 记为$ Y\thicksim\chi^p(n) $, 其密度函数为
定义2.3 设$ X $服从$ \mu=0 $、$ \sigma=1 $的一维P-范分布, $ Y $服从$ \chi^p(n) $分布, 且$ X $与$ Y $相互独立, 则
服从自由度为$ n $的$ t_p $分布, 记为$ T\sim t_p(n) $, 其密度函数为
定义2.4 设$ X $、$ Y $分别服从自由度为$ m, n $的$ \chi^p $分布, 且$ X $与$ Y $相互独立, 则
服从第一自由度为$ m $、第二自由度为$ n $的$ F_p $分布, 记为$ Z\sim F_p(m, n) $, 其密度函数为
式中$ B(x, y) $为贝塔函数.
本节假定$ \mu $已知, 不失一般性假定$ \mu=0 $. 当$ \mu $未知时, 由于此时一元P-范分布的极大似然估计(参见文献[5])不易求出, 所以在实际应用中用其矩估计$ \bar{x}=n^{-1} \sum\limits_{i=1}^nx_i $替代, 仍可采用下面的密度函数进行近似计算.
本小节我们考虑单个总体的尺度参数的假设检验问题. 设随机样本$ x_1, x_2, \cdots, x_n $独立同分布, 取自参数为$ \mu $和$ \sigma $的P-范分布, 检验问题为
其中$ \Theta_0 $和$ \Theta_1 $分别为原假设和备择假设的参数空间. 如记
则似然比检验统计量定义为
定理3.1 记$ \sigma^p $的极大似然估计为
对于检验$ H_0:\sigma=\sigma_0\leftrightarrow H_1:\sigma\neq\sigma_0 $问题, 有
(1) 似然比检验统计量
其中$ \xi=\frac{p\lambda^p}{n} \sum\limits_{i=1}^n\frac{|x_i|^p}{\sigma_0^p} $的分布为$ \chi^p(n) $.
(2) $ -\frac{2n}{p}\log{\xi} $的密度函数为
(3) 当$ n $足够大时, $ \lambda_n $的近似密度函数为
其中$ C=\int_{-\infty}^\infty\left(\frac{n}{p}\exp\left\{-\frac{py}{2n}\right\}\right)^{n/p-1}\exp\left\{\frac{(n-p)y}{2n}\right\}dy $.
证 (1) 由(3.2)和(3.3)式得
注意到$ E\chi^p(n)=\frac{n}{p\lambda^p}, Var\chi^p(n)=\frac{n}{p\lambda^{2p}} $(参见文献[4]), 由大数定理容易证明:
由此得到
于是
其中$ \xi={\frac{p\lambda^p}{n}} \sum\limits_{i=1}^n\frac{|x_i|^p}{\sigma_0^p} $的分布是$ \chi^p(n) $.
(2) 由$ \xi $密度函数
可得到$ -\frac{2n}{p}\log\xi $的密度函数为
(3) 当$ n\rightarrow \infty $时, 有$ \frac{py}{2n}\rightarrow0 $和$ \exp\left\{-\frac{py}{2n}\right\}\approx 1-\frac{py}{2n} $, 从而有
于是可得
其中
因此, $ \lambda_n $的近似密度函数为
注 当$ |\lambda_n| $偏大时, 拒绝$ H_0 $, 认为两总体方差有显著性差异; 当$ |\lambda_n| $接近0时, 接受$ H_0 $, 认为两总体方差没有显著性差异.
注意到$ (\Gamma(3)/\Gamma(1))^{1/2}=\sqrt{2} $和$ (\Gamma(3/2)/\Gamma(1/2))^{1/2}=1/\sqrt{2} $, 由定理3.1容易得到下面的两个推论, 在此略去证明.
推论3.1 (拉普拉斯分布) 令$ p=1 $, $ \hat{\sigma}_n=\frac{\sqrt{2}}{n} \sum\limits_{i=1}^n|x_i| $, 则$ \frac{\lambda_n}{n}\stackrel{D}{\longrightarrow}-2\log\xi $, 其中$ \xi=\frac{\sqrt{2}}{n} \sum\limits_{i=1}^n\frac{|x_i|}{\sigma_0} $服从$ \chi(n) $. 且$ \lambda_n $的近似密度函数为
推论3.2 (正态分布)令$ p=2 $, 则$ \frac{\lambda_n}{n}\stackrel{D}{\longrightarrow}-\log\xi $, 其中$ \xi=\frac{1}{n} \sum\limits_{i=1}^n{\frac{x_i^2}{\sigma_0^2}} $服从的分布是$ \chi^2(n) $. 进而$ \lambda_n $的近似密度函数为
本小节我们考虑两个总体的尺度参数的假设检验问题. 设随机样本$ x_1, x_2, \cdots, x_n $独立同分布, 取自参数为$ \mu_1, \sigma_1 $的P-范分布; $ y_1, y_2, \cdots, y_n $独立同分布, 均取自参数为$ \mu_1, \sigma_1 $的P-范分布; 而且两个样本相互独立. 仍不妨假定$ \mu_1=0, \mu_0=0 $. 检验如下问题
为了将(3.5)式适用于两个总体的尺度参数检验, 我们将它适当修改成如下似然比检验统计量
其中$ \tilde{\Theta}_1 $和$ \tilde{\Theta}_2 $分别为第一、二个总体所对应的参数空间, $ \sigma_1^p $和$ \sigma_2^p $对应的极大似然估计分别为
定理3.2 似然比统计量$ \lambda_n=\frac{2}{p}\left\{\log({\hat{\sigma}_{1n_1}}^{pn_1}/{\hat{\sigma}_{2n_2}}^{pn_2})+(n_1-n_2)\right\} $的密度函数为
证 经计算容易得到$ {\hat{\sigma}_n}^p=\frac{p}{n}\left(\Gamma(3/p)/\Gamma(1/p)\right)^{p/2}\sigma^p \sum\limits_{i=1}^{n}\frac{|x_i|^p}{\sigma^p} $的密度函数如下:
由此可以得到$ {\hat{\sigma}_n}^{pn}=\left\{\frac{p}{n}\lambda^p\sigma^p \sum\limits_{i=1}^{n}\frac{|x_i|^p}{\sigma^p}\right\}^n $的密度函数为
由(3.11)和(3.14)式可得$ Z={\hat{\sigma}_{1n_1}}^{pn_1}/{\hat{\sigma}_{2n_2}}^{pn_2} $的密度函数为
由(3.11)和(3.15)式可得$ \lambda_n=\frac{2}{p}\left\{\log({\hat{\sigma}_{1n_1}}^{pn_1}/{\hat{\sigma}_{2n_2}}^{pn_2})+(n_1-n_2)\right\} $的密度函数为
由于定理3.2的结论较复杂不便于应用, 所以下面我们考虑其特殊情形, 即$ n_1=n_2=n $. 利用定理3.2及其证明容易得到如下较简单的结论:
推论3.3 若$ H_0 $成立, 且$ n_1=n_2=n $, 则$ \lambda_n=\frac{2n}{p}\log\left(\frac{\hat{\sigma}_{1n}}{\hat{\sigma}_{2n}}\right)^p $的密度函数为
证 注意到
即$ \left({\hat{\sigma}_{1n}}/{\hat{\sigma}_{2n}}\right)^p $的密度函数为
于是由(3.11)和(3.18)式得$ \lambda_n=\frac{2n}{p}\log\left(\frac{\hat{\sigma}_{1n}}{\hat{\sigma}_{2n}}\right)^p $的密度函数为
由推论3.3易得推论3.4和推论3.5, 在此略去证明.
推论3.4 令$ p=1 $, 则在推论3.3的条件下, $ \lambda_n=2n\log({\hat{\sigma}_{1n}}/{\hat{\sigma}_{2n}}) $的密度函数为
推论3.5 令$ p=2 $, 则在推论3.3的条件下, $ \lambda_n=n\log({\hat{\sigma}_{1n}}^2/{\hat{\sigma}_{2n}}^2) $的密度函数为
本节将选取不同的$ p $值进行似然比检验. 由下面3个例子可以看出, 检验结果均与模拟数据相符, 从而说明了我们理论结果的可靠性.
例1 在(2.1)式中令$ p=2, \mu=0, \sigma=2 $, 随机产生100组样本, 其中样本容量为100. 我们根据每组样本值求出统计量, 并将100个样本统计量求和取平均进行模拟实验(显著性水平取为$ \alpha=0.05 $).
(1) 检验$ H_0:\sigma=3\leftrightarrow H_1:\sigma\neq3 $.
根据样本可以计算得
由定理3.1中(2)式得
解得: $ q_1=-25.8983, q_2=29.8111 $. 由于$ \bar{\lambda}_n>q_2 $, 并且在计算100个样本统计量时, 结果显示最小的统计量$ \lambda_n $大于$ q_2 $, 所以得到拒绝$ H_0 $.
(2) 检验$ H_0:\sigma=2\leftrightarrow H_1:\sigma\neq2 $.
由于$ q_1<\bar{\lambda}_n<q_2 $, 并且结果显示所求统计量$ \lambda_n $的最大值和最小值在$ (q_1, q_2) $, 所以接受$ H_0 $.
例2 在(2.1)式中令$ p=1, \mu_1=\mu_1=0, \sigma_1=2, \sigma_2=1 $, 从两个总体中分别随机产生容量为100的样本, 检验$ H_0:\sigma_1=\sigma_2\leftrightarrow H_1:\sigma_1\neq\sigma_2 $(显著性水平取为$ \alpha=0.05 $).
根据样本计算得
由推论3.3中(3.17)式得
其中$ q_1=-59.7589, q_2=47.4423 $. 由于$ \bar{\lambda}_n>q_2 $, 并且模拟结果显示, 统计量$ \lambda_n $最小值大于$ q_2 $, 所以拒绝$ H_0 $, 认为两总体方差有显著性差异.
例3 在(2.1)式中令$ p=4, \mu_1=\mu_1=0, \sigma_1=1, \sigma_2=1 $, 随机产生容量为100的两个样本, 检验$ H_0:\sigma_1=\sigma_2\leftrightarrow H_1:\sigma_1\neq\sigma_2 $(显著性水平取为$ \alpha=0.05 $).
其中$ q_3=-32.4755, q_4=17.6155 $. 由于$ q_3<\bar{\lambda}_n<q_4 $, 并且结果显示所求统计量$ \lambda_n $的最大值和最小值在$ (q_1, q_2) $, 所以接受$ H_0 $, 认为两总体方差没有显著性差异.