数学杂志  2016, Vol. 36 Issue (6): 1253-1260   PDF    
扩展功能
加入收藏夹
复制引文信息
加入引用管理器
Email Alert
RSS
本文作者相关文章
卢国祥
李冰清
基于对称交互熵的多属性决策排序法
卢国祥1,2,3, 李冰清2    
1. 中南财经政法大学统计与数学学院, 湖北 武汉 430073;
2. 南开大学金融学院, 天津 300071;
3. 南开大学经济学院, 天津 300071
摘要:本文研究了多属性决策的排序问题.利用信息熵理论提出了对称交互熵概念, 定义了一种新的与理想方案的贴近度, 由此给出了基于对称交互熵的排序方法.最后通过算例将新方法与传统的TOPSIS法、夹角度量法和正交投影法作对比, 获得了新方法能够更加精确地判断方案优劣的结果.
关键词多属性决策    对称交互熵    TOPSIS法    相对贴近度    
EVALUATION METHOD BASED ON SYMMETRIC CROSS ENTROPY FOR MULTIPLE ATTRIBUTE DECISION MAKING
LU Guo-xiang1,2,3, LI Bing-qing2    
1. School of Statistics and Mathematics, Zhongnan University of Economics and Law, Wuhan 430073, China;
2. School of Finance, Nankai University, Tianjin 300071, China;
3. School of Economics, Nankai University, Tianjin 300071, China
Abstract: The evaluation problem for multiple attribute decision making is studied in this paper. By using the symmetric cross entropy which comes from the information entropy theory, a new relative closeness to the ideal solutions is defined. Therefore, a new evaluation method based on symmetric cross entropy for multiple attribute decision making is developed. Finally, the new method is compared with traditional TOPSIS method, angle measure evaluation method and vertical projection method using merical examples and it can obtain more precise results.
Key words: multiple attribute decision making     symmetric cross entropy     TOPSIS method     relative closeness    
1 引言

TOPSIS法是多属性决策分析中常用的有效方法, 通过检测被评方案与理想方案和负理想方案的距离来进行排序, 具有计算简便、评估清晰的特点.然而该方法也有不足之处:比如不同方案与理想方案和负理想方案距离相等时便无法区分优劣, 与理想方案更接近的方案可能与负理想方案也更接近[1].因此学者们对此方法的改进做了很多研究, 论文[2]推广了TOPSIS法的适用范围并提出了夹角度量法, 文献[3]提出了基于“垂面”距离的正交投影法等, 但是这些方法还是或多或少存在一些不足[4].近年来学者们注意到信息论中的熵概念, 将熵和熵优化理论应用到决策分析上:比如论文[5]提出了基于信息熵的多属性参数系统决策方法, 文献[6]提出了基于相对熵的多属性决策组合赋权法, 文献[7]运用相对熵理论提出多粒度语言信息群决策方法, 文献[8]提出了基于相对熵的多属性决策排序法等.不过相对熵不具有对称性, 在应用中排序可能会出现前后不一致的情况, 为克服这一问题, 本文从信息论角度提出对称交互熵的概念, 结合TOPSIS法的思想定义新的方案贴近度, 得到新的多属性决策排序法.并将新方法与传统的TOPSIS法、夹角度量法和正交投影法进行对比, 得到新方法优于前面的方法的结果.

2 对称交互熵的基本概念

在信息论中, 衡量系统差异的一个最重要概念是相对熵[9].

定义2.1  离散概率分布 $P=(p_1, p_2, \cdots, p_n)$ $Q=(q_1, q_2, \cdots, q_n)$之间的相对熵定义为

$ \begin{eqnarray} D(P \parallel Q) = \sum\limits_{i=1}^n p_i \log\frac{p_i}{q_i}. \end{eqnarray} $ (2.1)

定义2.2  对两个系统

$ A = \{ A_1, A_2, \cdots, A_n\}, ~~ B = \{ B_1, B_2, \cdots, B_n\}, $

其中 $0 \leq A_i \leq 1$, $0 \leq B_i \leq 1$, $i = 1, 2, \cdots, n$, 其系统状态之间的差异程度可表示为

$ \begin{eqnarray} C(A, B) = \sum\limits_{i=1}^n\left[A_i \log\frac{A_i}{B_i} + (1-A_i) \log\frac{1-A_i}{1-B_i} \right]. \end{eqnarray} $ (2.2)

$C(A, B)$为系统 $A$ $B$的相对熵[8].

尽管相对熵可以衡量系统差异, 然而它并不满足对称性和三角不等式, 因此不是两个系统之间的真正距离.不过将它视为两个系统的差异测度还是有其实际意义, 比如相对熵 $C$越小, $A$ $B$之间的差异程度越小, 当 $A=B$时, $C=0$.下面我们在保持以上性质的基础上对其进行改进, 以满足对称性和有界性, 避免出现 $ A_i $ $ B_i \rightarrow 0~ (\mbox{或}1) $时相对熵的值趋向于无穷大的情况.

定义2.3  对两个系统 $A = \{ A_1, A_2, \cdots, A_n\}$, $B = \{ B_1, B_2, \cdots, B_n\}$, 称

$ \begin{eqnarray} & &BC(A, B) = C \left( A, \frac{A+B}{2} \right) + C \left( B, \frac{A+B}{2} \right) \nonumber \\ & = &\sum\limits_{i=1}^n \bigg[A_i \log\frac{2 A_i}{A_i + B_i} + (1-A_i) \log\frac{2(1-A_i)}{2-A_i-B_i} \nonumber \\ &&+ B_i \log\frac{2 B_i}{A_i + B_i} + (1-B_i) \log\frac{2(1-B_i)}{2-A_i-B_i} \bigg] \end{eqnarray} $ (2.3)

为系统 $A$ $B$的对称交互熵.为了保证以上定义的函数在 $A_i$ $B_i =0~ (\mbox{或}1)$时有意义并满足连续性, 规定

$ 0\log{\frac{0}{x}}=0, x \geq 0. $

对称交互熵 $BC(A, B)$满足以下性质:

定理2.4  对两个系统

$ A = \{ A_1, A_2, \cdots, A_n\}, ~~ B = \{ B_1, B_2, \cdots, B_n\}, $

它们的对称交互熵 $BC(A, B)$满足

(1) $BC(A, B) \geq 0$, 并且等号成立的充分必要条件是 $ A = B $;

(2) $BC(A, B) = BC(B, A)$;

(3) $BC(A, B) \leq 2n$.

  由(2.3) 式中相对熵的性质可知(1) 成立. (2) 成立可由(2.3) 式的形式看出.下面证明(3).因为

$ \begin{eqnarray*} BC(A, B)&=&\sum\limits_{i=1}^n \bigg[A_i \log\frac{2 A_i}{A_i + B_i} + (1-A_i) \log\frac{2(1-A_i)}{2-A_i-B_i} \\ &&+ B_i \log\frac{2 B_i}{A_i + B_i} + (1-B_i) \log\frac{2(1-B_i)}{2-A_i-B_i} \bigg] \\ & =&\sum\limits_{i=1}^n \bigg[A_i \log 2 + A_i \log\frac{A_i}{A_i + B_i} + (1-A_i) \log 2+ (1-A_i)\log\frac{1-A_i}{2-A_i-B_i} \\ &&+ B_i \log2 +B_i \log\frac{B_i}{A_i + B_i} + (1-B_i) \log 2 + (1-B_i) \log\frac{1-B_i}{2-A_i-B_i} \bigg] \\ & \leq&\sum\limits_{i=1}^n \left[A_i + (1-A_i)+B_i+(1-B_i) \right] = 2n. \end{eqnarray*} $
3 TOPSIS法的回顾[10]

$M=\{1, 2, \cdots, m\}$, $N=\{1, 2, \cdots, n\}$, 设多属性决策问题中有 $m$个方案 $A_1, A_2, \cdots, $ $A_m$, $n$个指标 $B_1, B_2, \cdots, B_n$, 令 $Y=\{ y_{ij} \}_{m \times n}$为决策矩阵(即 $y_{ij}$表示方案 $A_i$在指标 $B_j$下的初始属性值), $Z=\{ z_{ij} \}_{m \times n}$为标准化决策矩阵, $w_j$为指标 $B_j$的权重( $j \in N$), $X=\{ x_{ij} \}_{m \times n}$为加权标准化决策矩阵. TOPSIS法的建立步骤如下:

(1) 由决策矩阵 $Y=\{ y_{ij} \}_{m \times n}$建立标准化决策矩阵 $Z=\{ z_{ij} \}_{m \times n}$ (即无量纲化):

$ \begin{eqnarray} z_{ij}=\frac{y_{ij}}{\sqrt{\sum\limits_{i=1}^m y_{ij}^2}}, \quad i \in M, ~ j \in N. \end{eqnarray} $ (3.1)

(2) 计算加权标准化决策矩阵 $X=\{ x_{ij} \}_{m \times n}$:

$ \begin{eqnarray} x_{ij}=w_j z_{ij}. \end{eqnarray} $ (3.2)

(3) 确定理想解 $X^+$和负理想解 $X^-$:

$T_1$, $T_2$分别表示效益型指标(正向指标)和成本型指标(负向指标)的下标集合, 则

$ x_j^ + = \mathop {\max }\limits_{i \in M} \left\{ {{x_{ij}}} \right\}, x_j^ - = \mathop {\min }\limits_{i \in M} \left\{ {{x_{ij}}} \right\}, j \in {T_1}; $ (3.3)
$ x_j^ + = \mathop {\min }\limits_{i \in M} \left\{ {{x_{ij}}} \right\}, x_j^ - = \mathop {\max }\limits_{i \in M} \left\{ {{x_{ij}}} \right\}, j \in {T_2}. $ (3.4)

(4) 计算各方案与理想解和负理想解的欧氏距离:

$ ed_i^ + = \sqrt {\sum\limits_{j = 1}^n {{{(x_j^ + - {x_{ij}})}^2}} }, \quad i \in M, $ (3.5)
$ ed_i^ - = \sqrt {\sum\limits_{j = 1}^n {{{(x_j^ - - {x_{ij}})}^2}} }, \quad i \in M. $ (3.6)

(5) 计算各方案与理想解的相对贴近度:

$ \begin{eqnarray} C_i = \frac{ed_i^-}{ed_i^+ + ed_i^-}, \quad i \in M, \end{eqnarray} $ (3.7)

按照 $C_i$从大到小的顺序给所有方案 $A_i$排序, 前者优于后者.

4 对称交互熵排序法和主要性质

由TOPSIS法的定义可知衡量不同方案的差异所采用的是欧氏距离, 但不足之处主要有:与理想解的欧氏距离更近的被评方案可能与负理想解的欧氏距离也更近, 方案对应的点可能恰好落在理想解和负理想解对应的中垂线上等, 这就会导致排序结果并不能反映出各被评方案的优劣程度.因此考虑将欧氏距离替换为对称交叉熵, 使多属性决策中的被评方案与理想方案的接近程度用对称交叉熵来测度, 这样便可以有效克服上述的问题.下面利用各方案对应的加权标准化决策矩阵 $X=\{ x_{ij} \}_{m \times n}$的第 $i$行, 分别与理想方案 $X^+$和负理想方案 $X^-$算对称交互熵, 然后定义一种新的贴近度, 根据此贴近度将所有方案进行排序, 称这种方法为对称交互熵排序法.

定义4.1  记 $S_i^+$ $S_i^-$分别为方案 $A_i$(即矩阵 $X$的第 $i$个行向量)与理想方案 $X^+=(x_1^+, x_2^+, \cdots, x_n^+)$和负理想方案 $X^-=(x_1^-, x_2^-, \cdots, x_n^-)$的对称交互熵, 即有

$ \begin{array}{l} S_i^ + = \sum\limits_{j = 1}^n [x_j^ + \log \frac{{2x_j^ + }}{{x_j^ + + {x_{ij}}}} + (1-x_j^ + )\log \frac{{2(1-x_j^ + )}}{{2-x_j^ + - {x_{ij}}}}\\ \;\;\;\;\; + {x_{ij}}\log \frac{{2{x_{ij}}}}{{x_j^ + + {x_{ij}}}} + (1 - {x_{ij}})\log \frac{{2(1 - {x_{ij}})}}{{2 - x_j^ + - {x_{ij}}}}], \end{array} $ (4.1)
$ \begin{array}{l} S_i^ - = \sum\limits_{j = 1}^n [x_j^-\log \frac{{2x_j^-}}{{x_j^-+ {x_{ij}}}} + (1 - x_j^ - )\log \frac{{2(1 - x_j^ - )}}{{2 - x_j^ - - {x_{ij}}}}\\ \;\;\;\;\;\;\;\;\; + {x_{ij}}\log \frac{{2{x_{ij}}}}{{x_j^ - + {x_{ij}}}} + (1 - {x_{ij}})\log \frac{{2(1 - {x_{ij}})}}{{2 - x_j^ - - {x_{ij}}}}]. \end{array} $ (4.2)

下面根据 $S_i^+$ $S_i^-(i \in M)$引入一种新的与理想方案的相对贴近度

$ \begin{eqnarray} P_i=\frac{S_i^-}{S_i^+ + S_i^-}, \quad i \in M. \end{eqnarray} $ (4.3)

为讨论 $S_i^+$ $S_i^-$的性质, 先有以下引理成立.

引理4.2[9]  (对数和不等式)对于非负数 $a_1, a_2, \cdots, a_n$ $b_1, b_2, \cdots, b_n$,

$ \begin{eqnarray*} \sum\limits_{i=1}^n a_i \log\frac{a_i}{b_i} \geq \left(\sum\limits_{i=1}^n a_i \right) \log\frac{\sum\limits_{i=1}^n a_i}{\sum\limits_{i=1}^n b_i} \end{eqnarray*} $

当且仅当 $\displaystyle \frac{a_i}{b_i}=$常数, 等号成立.

该引理的证明可参见文献[9]中定理2.7.1.

定理4.3  多属性决策问题的对称交互熵 $S_i^+$ $S_i^-$满足下列性质:

(1) $S_i^+ \geq 0, \, S_i^- \geq 0$;

(2) $S_i^+ = 0 $当且仅当 $A_i = X^+$, $S_i^- = 0 $当且仅当 $A_i = X^-$;

(3) $S_i^+ \leq 2n, \, S_i^- \leq 2n$.

  由引理4.2, 有

$ \begin{eqnarray*} S_i^+&=&\frac{1}{2} \sum\limits_{j=1}^n \bigg[2 x_j^+ \log\frac{2 x_j^+}{x_j^+ + x_{ij}} + 2(1-x_j^+) \log\frac{2(1-x_j^+)}{2-x_j^+-x_{ij}} \nonumber \\ &&+2 x_{ij} \log\frac{2 x_{ij}}{ x_j^+ + x_{ij}} + 2 (1-x_{ij}) \log\frac{2(1-x_{ij})}{2- x_j^+-x_{ij}} \bigg] \\ & \geq&\frac{1}{2} \left[\sum\limits_{i=1}^n (2 x_j^+ + 2(1-x_j^+) + 2 x_{ij} + 2 (1-x_{ij})) \right] \\ &&\times \log\frac{\sum\limits_{i=1}^n [2 x_j^+ + 2(1-x_j^+) + 2 x_{ij} + 2 (1-x_{ij})]}{\sum\limits_{i=1}^n [2(x_j^+ + x_{ij}) + 2(2-x_j^+-x_{ij})]} \\ & =&\frac{4n}{2} \log\frac{4n}{4n} = 0. \end{eqnarray*} $

等号成立的条件当且仅当

$ \frac{2 x_j^+}{ x_j^+ + x_{ij}} = \frac{2(1- x_j^+)}{2- x_j^+ -x_{ij}}= \frac{2 x_{ij}}{ x_j^+ + x_{ij}}=\frac{2(1-x_{ij})}{2- x_j^+ -x_{ij}}, \quad j=1, 2, \cdots, n. $

$x_{ij}=x_j^+$, 故 $A_i=X^+$.同理可证 $S_i^- \geq 0$并有 $S_i^- = 0 $当且仅当 $A_i = X^-$. (1), (2) 得证.

(3) 由定理2.3(3) 得到.

在计算过程中, 由对称性可知不需要关注 $X^+, X^-$ $A_i$的相互顺序.

定义4.4  假设 $X^+ \neq X^-$, 则可以用 $P_i$描述方案 $A_i(i \in M)$关于理想方案 $X^+$的接近程度, 并且 $P_i$越大越接近理想方案 $X^+$.排序原理为

Ⅰ. $P_i$越大, 则相应的方案越好;

Ⅱ.若 $P_i= P_j$, 则可用 $S_i^+$ $S_j^+$区别 $X_i$ $X_j$的优劣, $S_i^+$越小越好.

于是交互熵排序法的具体步骤为

(1)、(2)、(3) 步与TOPSIS法的(1)、(2)、(3) 步保持一致.

(4) 分别由(4.1) 和(4.2) 式计算各方案与理想方案及负理想方案的对称交互熵.

(5) 由(4.3) 式计算各方案与理想方案的相对贴近度 $P_i$.按照 $P_i$从大到小的顺序给所有方案 $A_i$排序, 前者优于后者.若 $P_i= P_j$, 则比较 $S_i^+$ $S_j^+$, 小的对应方案优于大的对应方案.

5 决策实例

下面把本文提出的基于对称交互熵的排序法同传统的TOPSIS法、夹角度量法和正交投影算法进行对比.

例1[2]  设有决策矩阵

$ \begin{array}{cc} &\begin{array}{cc} B_1 \quad&B_2 \quad \end{array} \\ A=&\left[\begin{array}{cc} 2&1 \\ 1&5+2\sqrt{6} \end{array} \right], \end{array} $

这里属性 $B_1$ $B_2$都是收益型的, 即 $T_1=\{1, 2\}$, 属性权向量 $w=(2/3, 1/3)$.由(3.1)-(3.4) 式求得加权标准化矩阵 $X$, 理想解 $X^+$和负理想解 $X^-$如下

$ \begin{eqnarray*} &&Z= \left[\begin{array}{cc} \frac{4}{3\sqrt{5}}&\frac{1}{3\sqrt{5}(2+\sqrt{6})} \\ \frac{2}{3\sqrt{5}}&\frac{5+2\sqrt{6}}{3\sqrt{5}(2+\sqrt{6})} \end{array} \right], \\ &&X^+=\left( \frac{4}{3\sqrt{5}}, \frac{5+2\sqrt{6}}{3\sqrt{5}(2+\sqrt{6})} \right), \\ && X^-=\left( \frac{2}{3\sqrt{5}}, \frac{1}{3\sqrt{5}(2+\sqrt{6})} \right). \end{eqnarray*} $

由文献[2]和本文第4节提出的方法可得表 1.

表 1 基于欧氏距离的TOPSIS法、夹角度量法和对称交互熵排序法的计算结果

由上表可知传统的TOPSIS法基于欧氏距离无法区分方案 $A_1$ $A_2$的优劣.而根据[2]中的夹角度量法, 可得方案 $A_2$优于 $A_1$.根据对称交互熵排序法同样得到方案 $A_2$优于 $A_1$.这说明对称交互熵排序法确实可以解决方案对应的点恰好落在理想解和负理想解对应的中垂线上的问题.

例2[4]  某多属性决策问题加权标准化后的决策矩阵如下:

$ \begin{array}{cc} &\begin{array}{cc} B_1 \quad &B_2 \end{array} \\ X=&\left[\begin{array}{cc} 0.405&0.202 \\ 0.202&0.135 \\ 0.337&0.336 \\ 0.135&0.067 \end{array} \right], \end{array} $

其中 $B_1$为效益型指标, $B_2$为成本型指标.可得理想解

$ X^+ = (0.405, 0.067) $

和负理想解

$ X^- = (0.135, 0.336). $

分别采用基于欧氏距离的TOPSIS法、夹角度量法和正交投影法对其进行排序, 评价结果如表 2所示.

表 2 基于欧氏距离的TOPSIS法、夹角度量法和正交投影法的计算结果

表 2的结果可以看出, 采用夹角度量法时, 由于 $A_1=3 A_4$, 于是方案 $A_1$ $ A_4$与理想解和负理想解的夹角完全相同, 故夹角的贴近度也完全相同.但这两方案与理想解和负理想解的欧氏距离却不相同, $A_1$ $A_4$要靠近理想解, 远离负理想解, 因此采用夹角度量法大大提高了方案 $A_4$的贴近度, 显然这个结果不好.而基于欧氏距离的TOPSIS法和正交投影法也不能对这4种方案进行排序[4].最后我们采用对称交互熵排序法来求解, 评价结果如表 3所示.

表 3 对称交互熵排序法的计算结果

这样4种方案的优劣被完全区分了, 因此该方法优于前面提到的三种方法.

6 结论

本文将信息论中的相对熵概念推广, 提出对称交互熵概念, 并由此得到了基于对称交互熵的多属性决策排序法, 这种方法是对传统的TOPSIS法的改进.通过实例计算得知该方法有效可行, 针对传统的TOPSIS法、夹角度量法和正交投影法不能解决的排序问题可以有效给出方案的排序.该方法以及对它的进一步研究会有很好的应用前景.

参考文献
[1] 胡永宏. 对TOPSIS法用于综合评价的改进[J]. 数学的实践与认识, 2002, 32(4): 573–575.
[2] 刘树林, 邱菀华. 多属性决策的TOPSIS夹角度量法[J]. 系统工程理论与实践, 1996, 16(7): 12–17.
[3] 华小义, 谭景信. 基于"垂面"距离的TOPSIS法-正交投影法[J]. 系统工程理论与实践, 2004, 24(1): 114–119.
[4] 孔峰, 刘鸿雁. 对多属性决策问题中夹角度量法的质疑[J]. 数学的实践与认识, 2009, 39(2): 130–134.
[5] 余胜春. 基于信息熵的多属性参数系统决策方法[J]. 数学杂志, 2012, 32(6): 1111–1114.
[6] 周宇峰, 魏法杰. 基于相对熵的多属性决策组合赋权方法[J]. 运筹与管理, 2006, 15(5): 48–53.
[7] 王晓, 陈华友, 周礼刚, 陶志富. 基于相对熵的多粒度语言信息的多属性群决策方法[J]. 运筹与管理, 2010, 19(5): 95–100.
[8] 赵萌, 邱菀华, 刘北上. 基于相对熵的多属性决策排序方法[J]. 控制与决策, 2010, 25(7): 1098–1100.
[9] Cover T M, Thomas Joy A. Elements of information theory[M]. New York: John Wiley and Sons, 2006.
[10] Triantaphyllou E. Multi-criteria decision making: theory and applications[A]. Proceedings of 30th international conference of computers & industrial engineering[C]. Thessaloniki: Thessaloniki-Peres ZITI Press, 2002: 28-1.