2.2 博弈论的基础知识
2.2.1 博弈论简介
博弈论(Game Theory)[44]也称为对策论或赛局理论,作为应用数学的一个重要分支,其主要研究具有冲突、对抗或竞争现象的理论和方法。博弈论为竞争、对抗以及合作行为和现象提供了理论分析框架。最初,博弈论主要应用在经济学,近年来在生物学、社会学和工程应用等学科领域也得到了广泛应用。在2000年左右,研究者们开始将博弈论应用到无线通信中。作为一种重要的优化方法,博弈论在理论研究和实际应用方面都得到了不断发展。截至目前,已有 5 位研究博弈论的学者获得了诺贝尔经济学奖。1994 年,John Harsanyi、John Nash和Reinhard Selten因为在非合作博弈均衡分析的工作获奖;1996年,James A.Mirrlees和William Vickrey因为在信息经济学、激励理论研究获奖;2005年,Robert Aumann 和 Thomas Schelling 因为他们的研究促进了对合作和竞争关系的理解获奖;2007年,Leonid Hurwicz、Eric S.Maskin和Roger B.Myerson因为他们在机制设计理论方面的杰出贡献而获奖;2012年,Alvin Roth和Lloyd Shapley因为在匹配理论以及市场设计的相关实践研究方面的杰出贡献获奖。
从本质上讲,博弈论是研究决策主体的行为发生直接相互作用的决策以及决策均衡问题的理论[77]。在一个博弈过程中,基本要素主要包括参与者、策略集和效用函数[78]。参与者是指在博弈过程中根据自身目标函数进行决策优化的理性决策个体。策略集是指可供博弈参与者选择的所有行为或决策组成的空间。效用函数是指参与者在决策过程中所获得的效用(Utility)或收益(Payoff),用于指导所有博弈参与者决策或行为。在博弈模型的建模过程中,策略和效用应该具有明确的物理意义。此外,博弈中还有一个要素——次序(Order)。在一些博弈模型中,参与者的行为没有先后次序之分,同时进行行动,如势能博弈。然而,在另一些博弈模型中,博弈参与者的行为有先后顺序之分,如Stackelberg博弈,并且行为次序将会对博弈结果产生重要影响。一个标准型博弈模型的定义如下。
定义 2.1 (标准型博弈):一个标准型博弈可以用一个三元组表示G={N,{Sn}n∈N,{μn}n∈N},其中, N 表示博弈中的N个参与者,Sn表示博弈参与者n的策略空间,μn表示博弈参与者 n 的效用函数(Utility Function), S=S1× S2×...× SN为笛卡儿积(CartesianProduct),表示博弈的策略空间。
一般来讲,博弈模型可分为两类,即合作博弈和非合作博弈。合作博弈是指博弈参与者之间以合作的方式进行决策,参与者之间具有协议约束,一个参与者在做决策的过程中考虑对其他参与者的影响;非合作博弈是指博弈参与者以独立自私的方式进行决策而不考虑自身行为对其他博弈参与者的影响。在本书的研究内容中,所说的博弈均指非合作博弈。此外,根据对博弈模型中效用信息的掌握程度,可以分为完全信息博弈和不完全信息博弈。如果博弈模型中的所有参与者完全知道各种情况下的效用信息,此时具有完全信息,相应的博弈模型为完全信息博弈;反之,如果至少有部分参与者并不完全了解其他人的效用信息,相应的博弈模型为不完全信息博弈。