在风险理论[1]中, 如何对风险定义合适的保费是非常重要的. 在对风险定价时, 必须考虑到投保人的情况. 由于投保人年龄、性别等的不同, 他们的保费也有所不同. 这种保费的不一致性, 称此风险具有非齐次性. 制定这种风险的保费通常采用信度理论[2,3].
在信度理论中, 假设风险X可以由风险参数$\Theta$识别.由于风险的非齐次性, $\Theta $是一个随机变量, 它的取值服从分布$\pi(\theta)$, 称为结构分布或经验分布.风险X具有一系列观测值, 根据这些观测值估计或预测未来的风险X.信度原理就是利用先验分布$\pi(\theta)$与样本信息估计风险保费的一种方法.
但是大部分信度理论的结果都是在纯保费原理下获得的, 而纯保费不能满足保费的正的安全负荷.解决这个问题的办法之一是通过修改损失函数.这种想法最早是由Gerber[4]提出, 他将平方损失函数修改为指数加权平方损失函数, 得到了Esscher保费原理下的风险保费的信度估计. Furman, Zitikis在广义加权损失函数[5]下, 温利民分别在新型广义加权损失函数[6]、Linex损失函数[7]、指数损失函数[8]等损失函数下, 张佳佳在相对损失函数[9]下研究了信度模型问题.
利用熵损失函数已经有如下的研究:文献[10]研究了熵损失函数下两参数广义指数分布形状参数的Bayes估计, 文献[11]研究了在熵损失函数下定数截尾情形的参数估计, 文献[12]研究了熵损失函数下广义线性混合模型协方差矩阵谱的分解估计等等.目前作者还未见有报道利用熵损失函数研究信度模型.
本文将在熵损失函数下, 考虑风险保费的信度估计与保费估计.全文分为四节, 第二节给出信度模型的基本假设, 第三节给出熵损失函数下的信度估计, 最后给出多合同信度模型.
我们定义熵损失函数:
假设1 非负随机变量X可以由风险参数$\Theta$来识别, 风险参数的先验分布为$\pi(\theta)$.
假设2 给定$\Theta$, 随机变量序列$X_{1}, X_{2}, \cdots, X_{n}$独立同分布于X, 具有相同的分布函数$F_{X}(x, \theta)$, 记$\underline{X_{n}}=(X_{1}, X_{2}, \cdots, X_{n})$表示到时刻为止的索赔经历.
当风险参数$\Theta$已知时, 可以用$\Theta$的某个函数来预测第$n+1$年的损失$X_{n+1}$.
定理2.1 在熵损失函数(2.1) 下, 若风险参数$\Theta$已知, 则第$n+1$年的损失$X_{n+1}$的最优预测为
由于${\rm Cov}(X^{-1}, X | \Theta)\ge 0$, 则$H(X | \Theta)\ge E(X | \Theta)$, 其中$E(X | \Theta)\ge 0$为纯保费.因此风险保费$H(X|\Theta)$具有正的安全负荷.
在实际中, 风险参数$\Theta$是未知的, 因此风险保费$H(X|\Theta)$需要由样本来估计.
若没有索赔样本, 即$n=0$时, 可以用一个常数来估计风险保费$H(X | \Theta )$.
首先用某个常数$C$来预测第$n+1$年的损失$X_{n+1} $, 在熵损失函数(2.1) 下求解
得到
称$H_C (X)$为聚合保费.
其次, 用某个常数$R$来估计风险保费$H(X | \Theta)$, 即求解
称$H_R (X)$为风险保费的聚合估计.
根据第二节的假设, 我们有样本$X_1, X_2, \cdots, X_n $, 在此基础上来估计风险保费$H(X | \Theta)$, 假设$\mathfrak{L}$为$\underline{X_n }$的可测函数类.
定理3.1 在熵损失函数(2.1) 下, 得到$X_{n+1} $的最优预测为
称$H_C (\underline{X_n })$为熵损失函数(2.1) 下的Bayes保费.
证 由Bayes定理, 求解下列最小化问题
设
令$\frac{\partial \phi }{\partial h}=0$, 可以得到以下方程
于是
定理得证.
定理3.2 在熵损失函数(2.1) 下, 风险保费的最优估计为
称为熵损失函数(2.1) 下的风险保费的Bayes估计.
证 求解下列问题
可以得到定理的结论.
例 设$X_1, X_2, \cdots, X_n, X_{n+1} $在风险参数$\Theta =\theta $给定时为独立同分布的随机变量, 且$X_i\sim U ( a, \theta ), \theta \sim U ( c, d )$, 其中$a, c, d$已知, $a>0, c>0$, 则
那么聚合保费为
聚合估计为
而
因此Bayes保费为
Bayes估计为
假设有$k$个被保险人的保单组合, 每份保单都有若干年索赔记录, 则数据样本为$ \{{X_{ij}, i=1, 2, \cdots, k, j=1, 2, \cdots n_i } \}$.由于风险的非齐次性, 对每份保单有一种风险属性$\Theta _i $.我们的目标是估计$E ( {X_{i, n+1} | {\Theta _i } .} )=\mu ( {\theta _i } )$.
设$X_i = ( {X_{i1}, X_{i2}, \cdots, X_{in_i } } )^\prime $表示第$i$份保单的索赔经历, $n_i $表示第$i$份保单索赔样本的容量, 记
为所有的索赔样本.
结合经典Bühlmann-Straub模型, 提出3下面几个假设:
假设4.1 对第$i$份合同, $i=1, 2, \cdots, k$, 给定风险参数$\Theta _i =\theta _i $, 随机变量序列$ \{ {X_{ij}, j=1, 2, \cdots n_i } \}$独立同分布, 且条件期望与方差为
假设4.2 随机变量$\Theta _1, \Theta _2, \cdots, \Theta _k $相互独立, 并且具有相同的先验分布$\pi (\theta )$.
假设4.3 合同$ \{ { ( {X_i, \Theta _i } ), i=1, 2, \cdots, k} \}$之间相互独立.
为了方便, 作以下符号的假定:
可以验证
在多合同模型下, 熵损失函数(2.1) 下第$i$个合同的风险保费为
Bayes保费为
要求得Bayes保费, 必须知道$\Theta _i $与所有样本的联合分布.而在实际运用中, 一般很难知道样本的具体分布, 特别是先验分布的具体形式.因此用Bayes保费来定价保险产品受到很大的限制.但是, 若将$\mu ( {\theta _i } )$限定在样本的线性函数类
中, 则可得到样本的最优线性估计, 在信度理论中称之为信度保费.
为求第$i$个合同的信度保费, 我们先求解下面的最小化问题
求解上式得到下面的定理.
定理4.1 在多合同模型4.1--4.3的假设下, 求解(4.1) 式得到$\mu ( {\theta _i } )$的最优线性估计
其中信度因子为$ Z_{i}=\frac{n_{i}\sigma^{2}}{n_{i}\sigma^{2}+s^{2}}, $且$\overline{\mu_{i}} =\frac{1}{n_i }\sum\limits_{l=1}^{n_i } {X_{ml} ^{-1}} $, $h_{m\cdot } =\sum\limits_{l=1}^{n_i } {h_{ml} } $.
证 为下面记号方便, 令
其中$Y_{ml} =X_{ml} ^{-1}$.
首先关于$h_0$求导并令导数为0, 即$\frac{\partial \phi }{\partial h_0 }=0$, 得到
将上式带人$\varphi$中, 于是
对上式两边关于$h_{{m}'{l}'} $求导, 其中${m}'=1, 2, \cdots, k;{l}'=1, 2, \cdots, n_i, $并且令$ \frac{\partial \phi }{\partial h_{{m}'{l}'} }=0, $于是
化简后得到
那么当${l}'\ne l$时, ${\rm Cov} ( {Y_{{m}'l}, Y_{{m}'{l}'} } )=\sigma ^2$, 当${l}'=l$时, ${\rm Cov} ( {Y_{{m}'l}, Y_{{m}'{l}'} } )=s^2+\sigma ^2$, 且
于是(4.2) 式可化为
由(4.3) 式可得${m}'\ne i$时, $h_{{m}'l} \mbox{=}-\frac{\sigma ^2}{s^2}h_{m'}, $ ${m}'=i$时, $h_{{i}'l} \mbox{=}\frac{\sigma ^2}{s^2} ( {1-h_{i\cdot } } )$.即
因此$\mu ( {\theta _i } )$的最优线性信度估计为
注1 若$n_1 =n_2 =\cdots =n_i =n$, 此时称为平衡模型, 于是$ Z_i =\frac{n\sigma ^2}{n\sigma ^2+s^2}, \bar {\mu }_i =\frac{1}{n}\sum\limits_{l=1}^n {Y_{ml} } . $
注2 若$s^2\to \infty $, 则$Z_i \to 0$, 此时有$ \widehat {\mu(\theta _i)}\to \mu . $
注3 若$\sigma ^2\to \infty $, 则$Z_i \to 1$, 此时有$ \widehat {\mu(\theta _i )}\to \bar {\mu }_i . $
命题 $E [{ ( \mu (\theta _i )-\widehat{\mu(\theta_{i})} )^2 }]=Z_i \frac{s^2}{n_i }$.
证