博弈论, 又被称作“对策论”. 博弈行为指的是具有竞争性质或者对抗性质的行为, 主要涉及三个基本因素: 参与人、参与人的策略、参与人的收益. 根据参与人之间是否合作, 博弈可以划分为合作博弈和非合作博弈. 合作博弈是指参与人在博弈中选取策略的本意是其所在联盟的整体利益的最大, 因此它主要研究联盟的构建以及收益的分配问题. 在非合作博弈中, 参与人在博弈中选取策略的本意是其个人利益的最大, 它主要研究参与人自身策略的选择问题. 目前文献对合作博弈和非合作博弈分别都进行了大量的研究, 具体见文献[1–5]. 但单一的博弈形式往往不能满足现实情况, 因为在现实情况博弈中, 竞争和合作相互联系、相互影响, 所以不仅应考虑收益的分配, 还需要对策略进行选择.
为了解决此类博弈问题, Brandenburger和Stuart在文献[6]中首次提出了“Biform Game”的概念, 将非合作博弈和合作博弈进行了有机的结合, 被称为非合作-合作双型博弈. 随着双型博弈的提出, 后续很多学者对其进行深入研究和拓展, 尤其是双型博弈的求解问题. 很多学者在求解双型博弈时选取核心求解, 见文献[7–10], 但是核心可能为空或者不唯一. 为了保证核心的存在性和唯一性, 文献[6]要求合作博弈的特征函数满足加总性条件和无外部性条件, 但是很多实际问题却不一定满足这些条件. 后来, 南江霞等在文献[11]选取了Shapley值来求解双型博弈, 此方法是按照联盟中成员的边际贡献的比例来分配利益, 以此保证联盟的公平性, 但会忽略每个参与人的努力程度[12].
后来, 有学者研究了CIS值(Center of imputation set value), 并将其应用于双型博弈的求解, 文献[13]用此方法求解时要求特征函数满足无相关性条件, 不仅使参与人策略的改变不影响其他参与人的联盟收益, 也可以一定水平降低核心作为合作博弈解时的要求. CIS值的分配逻辑[14]是, 首先给每个参与人分配其个人收益, 然后把大联盟剩余收益平均分配给每一个参与人. 但结果导致参与人的收益区别在于其初始个人收益的不同, 一定程度上忽视了个人对于联盟的贡献. 2016年, 文献[15]将ED值和CIS值进行凸组合得到$ \alpha $-CIS值, 用于求解效用可转移合作博弈, 并证明其合理性.
受文献[13]的启发, 本文在求解非合作-合作双型博弈时采用$ \alpha $-CIS值对合作博弈阶段进行求解, 将求得的分配值作为非合作博弈阶段的支付值, 从而得出非合作博弈阶段的纯策略纳什均衡解. 在利用$ \alpha $-CIS值对双型博弈求解时, 首先令其特征函数满足无相关性条件; 然后, 采用$ \alpha $-CIS值作为双型博弈的均衡解, 证明了均衡解的存在性和相关性质; 最后, 通过两个数值实例说明基于$ \alpha $-CIS值的非合作-合作双型博弈均衡解的合理性, 并与文献[13]所采用的方法对比, 说明本文所给方法的有效性.
本文改进了文献[13]提出的基于CIS值的双型博弈模型, 提出基于$ \alpha $-CIS的非合作-合作双型博弈新理论框架, 在求解不满足无外部性条件的非合作-合作双型博弈问题的同时一定程度上强调个体的贡献性, 使双型博弈的求解方法更具普适性.
本节首先介绍非合作-合作双型博弈模型, 其次说明$ \alpha $-CIS值的定义.
定义 2.1 [6] 设参与人集合为$ N=\{1, 2, \cdots, n\} $, $ \rho(N) $是集合$ N $的幂集, 对于任意的联盟$ A $$ \subseteq $$ N $, 一个$ n $人非合作-合作双型博弈记为:
其中:
(1) 幂集是一个集合的所有子集组成的集合, 即表示所有可能形成的联盟的集合;
(2) 对于$ \forall i\in N $, $ s^i $为参与人$ i $选择的策略, 则参与人$ i $所有可能选择的策略为策略集$ S^i $, 即有$ s=(s^1, s^2, \cdots, s^n) $, $ S=(S^1 \times S^2 \times \cdots \times S^n) $;
(3) $ A $为联盟, 对于每个联盟$ A \subseteq N $, 参与人$ i $选择策略$ s^i $, 特征函数是$ V(s)(A):\rho(N) \to R $, 那么$ V(s^i)(A) $是$ N $的所有子集$ A $上的实值函数, 即联盟$ A $的收益, 通常情况下, $ V(s^i)(\emptyset)=0 $, $ \emptyset $表示空集;
(4) 对于$ \forall i\in N $, $ 0 \leq \alpha^i \leq 1 $, 其中$ \alpha^i $是参与人$ i $的信心指数.
在上述双型博弈的定义中: 条件(1)解释了什么是幂集; (2)刻画了参与人的策略选择; (3)说明了参与人形成联盟后的价值; (4)描述了参与人的乐观程度, 且参与人越乐观, 该指数越大.
如果合作博弈的解是单值解时, 信心指数可以忽略, 此时$ n $人非合作-合作双型博弈可以简记为[6]:
在最初提出的非合作-合作双型博弈中, 要求特征函数满足加总性、无外部性和不协调性时, 可以得到非合作-合作双型博弈的有效解. 具体的三个性质的定义如下:
定义 2.2 [6] 对于$ \forall i\in N $, 如果一个双型博弈$ (S^1, S^2, \cdots, S^n;V(s)(A)) $满足加总性条件, 则对每个策略局势$ s^i \in S^i $, 有:
加总性条件说明在双型博弈第2阶段的合作博弈中, 参与人的附加值之和等于该博弈中创造的总价值; 若特征函数符合该条件, 那么该合作博弈的核心存在且唯一.
定义 2.3 [6] 对于$ \forall i\in N $, 如果一个双型博弈$ (S^1, S^2, \cdots, S^n;V(s)(A)) $满足无外部性条件, 则对$ r^i, s^i \in S^i $, 且$ s^{-i} \in S^{-i} $, 有:
(1) $ s^{-i}=(s^1, \cdots, s^{i-1}, s^{i+1}, \cdots, s^n) $;
(2) $ S^{-i}=(S^1 \times S^2 \times \cdots \times S^{i-1} \times S^{i+1} \times \cdots \times S^n) $.
无外部性条件说明参与人的策略选择不会影响其他参与人所能得到的价值.
定义 2.4 [6] 对于$ \forall i\in N $, 如果一个双型博弈$ (S^1, S^2, \cdots, S^n;V(s)(A)) $满足不协调性条件, 则对$ r^i, s^i \in S^i $, 且$ r^{-i}, s^{-i} \in S^{-i} $, 有:
当且仅当
不协调性条件说明, 当一个参与人改变策略时, 对其所创造的整体价值的影响独立于其他参与者的策略选择. 或者说, 当其他参与人不改变其行为策略时, 没有参与人愿意改变其行为策略, 即保证非合作博弈纳什均衡解的存在[13].
$ \alpha $-CIS值是由ED值和CIS值进行凸组合得到的.
定义 2.5 [15] 在合作博弈$ V(s)(N) $中,对于任意参与人$ \forall i\in N $, $ s^ \in S $, $ 0 \leq \alpha^i \leq 1 $, 有:
将式(2.2)和式(2.3)代入式(2.1)有:
且$ \alpha $-CIS值具有总体有效性, 即:
本节首先讨论双型博弈均衡解的存在条件, 然后给出求均衡解的计算步骤.
非合作–合作双型博弈的均衡解定义如下.
定义 3.1 在双型博弈$ (S^1, S^2, \cdots, S^n;V(s)(A)) $中,对每个参与人$ i\in N, s \in S, r^i \in S^i $, 则$ s^{*}=(s^{1^*}, \cdots, s^{n^*}) \in S $为其非合作博弈的纯策略纳什均衡解时, 有:
此时参与人的获益价值也是该博弈的纳什均衡为$ (\varphi^\alpha_{1} (s^{*})(N), \varphi^\alpha_{2} (s^{*})(N), \cdots, \varphi^\alpha_{n} (s^{*})(N) ) $, 并将该非合作-合作双型博弈的均衡解记为$ \{ s^{*};(\varphi^\alpha_{1} (s^{*})(N), \varphi^\alpha_{2} (s^{*})(N), \cdots, \varphi^\alpha_{n} (s^{*})(N) ) \} $.
为研究基于$ \alpha $-CIS值的双型博弈均衡解存在的条件, 文献[13]定义无相关性条件如下:
定义 3.2 [13] 对于$ \forall i\in N $, 一个双型博弈$ (S^1, S^2, \cdots, S^n;V(s)(A)) $满足无相关性条件, 如果对$ r^i, s^i \in S^i $, 且$ r^{-i}, s^{-i} \in S^{-i} $, 有$ V(s)(i)=V(r^i, s^{-i})(i), $且
无相关性条件表示, 当参与人$ i $改变策略而其他参与人的策略不变时, 参与人$ i $的单值收益不变, 且其他参与人的单值收益之和也不变.
定义 3.3 [6] 在双型博弈$ (S^1, S^2, \cdots, S^n;V(s)(A)) $中如果存在$ s^{*} \in S $, 有:
则称策略局势$ s^{*} $具有有效性.
当双型博弈的特征函数满足无相关性条件时, 均衡解的存在性由下面定理3.1给出.
定理 3.1 假设双型博弈$ (S^1, S^2, \cdots, S^n;V(s)(A)) $的特征函数满足无相关性条件, 则$ \{ s^{*};(\varphi^\alpha_{1} (s^{*})(N), \varphi^\alpha_{2} (s^{*})(N), \cdots, \varphi^\alpha_{n} (s^{*})(N) ) \} $是该双型博弈的均衡解, 当且仅当对于任意的$ r^i \in S^i $, 有:
证 必要性:
假设$ \{ s^{*};(\varphi^\alpha_{1} (s^{*})(N), \varphi^\alpha_{2} (s^{*})(N), \cdots, \varphi^\alpha_{n} (s^{*})(N) ) \} $是双型博弈的均衡解, 则由定义3.1, 有:
由式(2.4)可得:
从而
则
再根据定义3.2, 且$ 0 \leq \alpha \leq 1 $, 有:
充分性:
因为$ V(s^{*})(N) \geq V(r^i, s^{{-i}^*})(N) $, 且双型博弈满足无相关性条件, 则对于$ 0 \leq \alpha \leq 1 $, 有:
从而$ \alpha V(s^{*})(i)+ \frac{1}{|N|} [V(s^{*})(N)- \sum_{j=1}^n \alpha V(s^{*})(j)] \geq \alpha V(r^i, s^{{-i}^*})(i)+ $$\frac{1}{|N|} [V(r^i, s^{{-i}^*})(N)- \sum_{j=1}^n \alpha V(r^i, s^{{-i}^*})(j)],$即
得证.
作为定理3.1的特殊情况, 可得到下面推论.
推论 3.1 假设双型博弈$ (S^1, S^2, \cdots, S^n;V(s)(A)) $满足$ V(s)(j)= V(r^i, s^{-i})(j), (j=1, 2, \cdots, n) $, 则对于任意的$ r^i \in S^i $, $ \{ s^{*};(\varphi^\alpha_{1} (s^{*})(N), \varphi^\alpha_{2} (s^{*})(N), \cdots, \varphi^\alpha_{n} (s^{*})(N) ) \} $是该双型博弈的均衡解, 当且仅当对于任意的$ r^i \in S^i $, 有:
假设$ \{ s^{*};(\varphi^\alpha_{1} (s^{*})(N), \varphi^\alpha_{2} (s^{*})(N), \cdots, \varphi^\alpha_{n} (s^{*})(N) ) \} $是该双型博弈的均衡解, 则由定义3.1, 有:
由式(2.4)可得
又$ V(s^{*})(j) = V(r^i, s^{{-i}^*})(j) $, 且$ 0 \leq \alpha \leq 1 $, 有$ V(s^{*})(N) \geq V(r^i, s^{{-i}^*})(N). \notag $
充分性: 因为$ V(s^{*})(N) \geq V(r^i, s^{{-i}^*})(N) $, 且$ V(s^{*})(j) = V(r^i, s^{{-i}^*})(j) $, 对于$ 0 \leq \alpha \leq 1 $,
即$ \varphi^\alpha_{i} (s^{*})(N) \geq \varphi^\alpha_{i} (r^i, s^{{-i}^*})(N), $得证.
定理 3.2 假设双型博弈$ (S^1, S^2, \cdots, S^n;V(s)(A)) $的特征函数满足无相关性条件和不协调性条件, 则当$ \{ s^{*};(\varphi^\alpha_{1} (s^{*})(N), \varphi^\alpha_{2} (s^{*})(N), \cdots, \varphi^\alpha_{n} (s^{*})(N) ) \} $是该双型博弈的均衡解时, $ s^{*} $是一个有效策略.
证
由定理3.1和不协调性条件可得上述等式的右边每个组合都非负, 从而$ V(s^{*})(N) \geq V(r)(N), $由定义3.3可知, 策略局势$ s^{*} $具有有效性.
定理 3.3 假设双型博弈$ (S^1, S^2, \cdots, S^n;V(s)(A)) $的特征函数满足无相关性条件, 当策略局势$ s^{*} $具有有效性时, $ \{ s^{*};(\varphi^\alpha_{1} (s^{*})(N), \varphi^\alpha_{2} (s^{*})(N), \cdots, \varphi^\alpha_{n} (s^{*})(N) ) \} $是该双型博弈的均衡解.
证 当策略局势$ s^{*} $具有有效性时, 对任意$ r \in S $, 可得
则式(3.1)成立, 再由定理3.1, 有$ \{ s^{*};(\varphi^\alpha_{1} (s^{*})(N), \varphi^\alpha_{2} (s^{*})(N), \cdots, \varphi^\alpha_{n} (s^{*})(N) ) \} $是该双型博弈的均衡解.
推论 3.2 假设双型博弈$ (S^1, S^2, \cdots, S^n;V(s)(A)) $满足$ V(s)(j)= V(r^i, s^{-i})(j) $和不协调性条件, 则当$ \{ s^{*};(\varphi^\alpha_{1} (s^{*})(N), \varphi^\alpha_{2} (s^{*})(N), \cdots, \varphi^\alpha_{n} (s^{*})(N) ) \} $是该双型博弈的均衡解时, 策略局势$ s^{*} $具有有效性.
推论 3.3 假设双型博弈$ (S^1, S^2, \cdots, S^n;V(s)(A)) $满足$ V(s)(j)= V(r^i, s^{-i})(j) $, 当策略局势$ s^{*} $具有有效性时, $ \{ s^{*};(\varphi^\alpha_{1} (s^{*})(N), \varphi^\alpha_{2} (s^{*})(N), \cdots, \varphi^\alpha_{n} (s^{*})(N) ) \} $是该双型博弈的均衡解.
本文中定理3.2和定理3.3及其推论都得到了与文献[6]相同的结论, 区别在于特征函数的要求. 文献[6]中非合作-合作双型博弈均衡解存在的充要条件是要求特征函数满足加总性条件和无外部性条件, 而本文的模型与文献[13]类似只需要特征函数满足无相关性条件; 同时本文对文献[6]给出的有效解的条件也做了弱化, 即特征函数满足无相关性条件和不协调性条件即可.
下面给出求解非合作-合作双型博弈均衡解的计算步骤.
步骤 1:首先得到一个合作博弈$ V(s)(N) $, 该合作博弈是在任意的策略局势$ s \in S $下形成的; 然后求该合作博弈$ V(s)(N) $的解, 利用$ \alpha $-CIS值对每个策略局势下进行求解. 本文将ED值看作效率分配, 将CIS值看作公平分配, 可以权衡效率与公平凸组合时$ \alpha $的取值. 比如令$ \alpha $的取值为$ \frac{1}{2} $, 从而参与人$ i(i=1, 2, \cdots, n) $在每个策略局势下的分配值就可以得到;
步骤 2:步骤1得到了参与人$ i(i=1, 2, \cdots, n) $的分配值, 将其作为每个策略局势$ s \in S $下非合作博弈的支付值, 以此形成非合作博弈, 再求解其纯策略纳什均衡解.
例 1 在一个简单供应链中, 有三个参与人, 分别记$ R_1, R_2 $和$ R_3 $, 他们之间既存在竞争元素也存在合作元素. 三个参与人都需要作出策略选择, 其目的都是使各自利益最大化. 每个参与人都有2个策略选择: 不做广告(记为0)和做广告(记为1). 表 1给出三个参与人在不同策略局势下的联盟效用值(数据主要来源于文献[13]). 如在策略局势(不做广告, 不做广告, 不做广告)即(0, 0, 0)下, 所形成的合作博弈的特征函数为$ V(1)=2, V(2)=3, V(3)=4, V(1, 2)=5, V(2, 3)=8, V(3, 1)=5, V(1, 2, 3)=11 $, 表示的是组成的不同联盟在此策略局势下的收益. 且通过表 1可以看出, 当参与人$ R_2 $和$ R_3 $都选择做广告时, 无论参与人$ R_1 $做广告与否, 其单值收益始终为2, 但是对于无参与人$ R_1 $参加的联盟收益会产生影响, 所以特征函数不满足无外部性, 从而表 1中特征函数对于加总性、无外部性和不协调性条件均不满足.
在三个参与人$ R_1, R_2 $和$ R_3 $之间既存在竞争元素也存在合作元素时, 可将其看作一个非合作-合作双型博弈, 利用文献[6]给出的方法求解时会发现策略局势(做广告, 做广告, 不做广告)即(1, 1, 0)的核心不存在, 导致无法求解. 利用文献[13]给出的方法求解其结果如表 2所示.
下面用本文给出的方法进行求解.
步骤 1:利用$ \alpha $-CIS值求解每个策略局势下的合作博弈的结果如表 3所示.
与文献[13]的方法相比, 虽然都可以求出合作博弈阶段的解, 但通过数值对比可以看出, 本文给出的方法在一定程度上使得初始个人价值较低的参与人获得了比文献[13]方法略高的收益值, 可以更好的进行分配, 在一定程度加强个人贡献程度的作用.
步骤 2:由步骤1形成的非合作博弈, 将参与人分配值作为非合作博弈的支付值, 可以求出非合作博弈的纯策略纳什均衡点有两个: $ s_1 $(做广告, 不做广告, 不做广告)即(1, 0, 0)和$ s_2 $(不做广告, 做广告, 做广告)即(0, 1, 1), 其对应的纳什均衡值为$ (\frac{21}{6}, \frac{21}{6}, \frac{30}{6}) $和$ (\frac{21}{6}, \frac{24}{6}, \frac{27}{6}) $, 则当参与人$ R_1, R_2 $和$ R_3 $选择上述策略局势的时候可以得到最大化的利润值为其纳什均衡值.
由上述分析可知例1中的特征函数满足无相关性条件, 且当参与人$ R_1, R_2 $和$ R_3 $选择策略局势$ s_1 $和$ s_2 $时, 有:
从而$ \{ s_1;(\frac{21}{6}, \frac{21}{6}, \frac{30}{6}) \} $和$ \{ s_2;(\frac{21}{6}, \frac{24}{6}, \frac{27}{6}) \} $为例1的均衡解. 反之也成立, 与定理3.1的结论具有一致性.
例 2 假设例1中的收益表如表 4所示.
对该双型博弈的合作阶段进行求解, 利用本文提出的双型博弈模型可得到结果如表 5所示.
由上述分析可知例2中的特征函数满足无相关性条件和不协调性条件, 求得非合作博弈阶段的纯策略纳什均衡点为: $ s_3 $(不做广告, 不做广告, 做广告)即(0, 0, 1)其对应的纳什均衡值为$ (\frac{25}{6}, \frac{28}{6}, \frac{31}{6}) $, 当参与人选择策略局势$ s_3 $时, 有$ V(s_3)(N) \geq V(r^i, s^{-i}_3)(N) $, 从而$ \{ s_3;(\frac{25}{6}, \frac{28}{6}, \frac{31}{6}) \} $为例2的均衡解, 与定理3.2的结论具有一致性.
非合作-合作双型博弈模型的提出是为了解决既包含了冲突元素又存在了合作元素的博弈问题, 而求解非合作-合作双型博弈的重中之重在于合作博弈阶段的求解. 本文提出并证明了采用$ \alpha $-CIS值对双型博弈合作博弈阶段的合作博弈进行求解的可行性, 进而得出非合作博弈阶段的非合作博弈的纯策略纳什均衡解. 虽然本文降低了文献[6]提出的求解要求, 也改进了文献[13]提出的求解方法, 但是$ \alpha $-CIS值本身并不符合个体合理性的要求, 故选其求解合作博弈时, 可能会影响联盟的稳定性, 因此可以进一步考虑其他形式的解.