首页 > 精品范文 > 经济博弈理论

经济博弈理论范文

时间：2023-10-08 15:33:14

序论：在您撰写经济博弈理论时，参考他人的优秀作品可以开阔视野，小编为您整理的7篇范文，希望这些建议能够激发您的创作热情，引导您走向新的创作高度。

经济博弈理论

第1篇

引言

一、两个简单的例子

1.1 老鹰（Hawk）与鸽子(Dove)博弈

1.2 系统选择博弈

二、进化博弈理论的产生及其发展

2.1 理性的由来及其缺陷

2.2 心理学研究成果及有限理性概念的提出

2.3 进化博弈理论的产生及其发展

三、进化博弈理论的基本内容

3.1 进化博弈理论基本模型分类

3.2 进化博弈理论基本均衡概念-----进化稳定策略

3.3 进化博弈理论基本动态概念----模仿者动态

四、进化博弈理论的应用

五、传统方法的缺陷及进化博弈理论研究方法的现实性

5.1 新古典经济学均衡分析法的缺陷

5.2 经典博弈理论的策略互动分析法及其缺陷

5.3 进化博弈理论局部动态分析方法的现实性

5.3.1 局部动态分析法的均衡观

5.3.2 局部动态法的时间观

5.3.3 局部动态法的均衡选择观

5.3.4 局部动态法的特殊性

六、结论

参考文献

摘要

本文从两个简单的博弈例子出发，以通俗的语言全面介绍了进化博弈理论的理性基础及其形成、发展、基本内容和部分应用，在此基础上文章进一步比较了新古典经济学、经典博弈理论 ①及进化博弈理论在研究方法上的不同之处，并特别强调了进化博弈理论局部动态法的均衡观、时间观、均衡选择观及方法上的特殊性。进化博弈理论的局部动态分析方法既是经济学研究方法的一次创新又是经济学直面现实的有力武器。

关键词：沉默互动；社会互动；进化稳定策略；模仿者动态；均衡分析法；局部动态法

引言

为什么同样一项经济制度在某个地方对经济发展有积极的推动作用而在另一个地方对经济发展却起着消极的阻碍作用？为什么能够有效降低交易费用的中介在一些地方会出现而在另一些地方却不能出现？为什么同样的管理方法在一个地方显示出高效率而在另一地方却不具有效率？诸如此类的问题，新古典经济学利用均衡分析法都无法给出令人满意的答案。均衡分析法的最大缺陷是把经济系统中参与人看作是互不联系的单个人（仅研究单个生产者或消费者的行为），不能把其所考察的问题放在一定的环境中去，该方法完全忽略了制度环境、社会环境及人文环境等对参与人行为的影响，单纯考察某个条件与结果之间的一一对应关系。因而，无法对现实中出现的诸多现象给予合理的解释。博弈理论尽管把参与人之间行为互动关系纳入到了模型之中，但依然没能跳出新古典均衡分析法的基本框架，并且由于其对理性赋予更强的假定，使得该理论更加脱离现实。进化博弈理论则一反常规，从一种全新的视角来考察经济及社会问题，它所提供的局部动态研究方法是从更现实的社会人出发，把其所考察的问题都置于一定的环境中进行更全面的分析，因而，其结论更接近于现实且具有较强的说服力。进化博弈理论属于经济学的前沿理论，该理论从其理论框架建立到现在仅仅只有近三十年的历史，但其在经济学、社会学、生态学等领域却得到了广泛的应用，近年来已经成为主流经济的研究方法之一。在我国由于历史原因，对经济学的研究起步较晚，特别对进化博弈这样的前沿理论更是知者甚少，本文的主要目的是以通俗的语言介绍进化博弈理论的相关内容及其应用，让读者对该理论有一个全面的了解。

本文的结构如下：第一部分给出进化博弈理论的两个典型的例子；第二部分对进化博弈理论的产生及其发展进行阐述；第三部分对进化博弈理论的基本内容进行简要的介绍；第四部分概述进化博弈理论的有关应用；第五部分论述传统的经济学研究方法的缺陷及进化博弈理论研究方法的现实性；第六部分对进化博弈理论的发展及理论前景进行简要的说明。

一、两个简单的例子

为了下文说明的方便，本文先给出进化博弈理论中两个具有代表性的例子，在此基础上再进一步给出该理论的基本内容及其研究方法的基本特点。

1.1 老鹰（Hawk）与鸽子(Dove)博弈

假定一个生态环境中有老鹰与鸽子两种动物，它们为了生存需要争夺有限的资源（如食物或生存空间等）而竞争。老鹰一般比较凶悍，必要时在斗争中直到重伤。鸽子一般比较温驯，竞争时在强敌面前常常退缩。竞争中获胜者得到了生存资源就可以更好地繁衍后代，重伤者则不利于其后代生长，即会减少其后代的数量。如果群体中老鹰与鸽子相遇并竞争资源，那么老鹰就会轻而易举地获得全部资源，而鸽子由于害怕强敌退出争夺，从而不能获得任何资源（当然不会受伤）；如果群体中两个鸽子相遇并竞争生存资源，由于它们均胆小怕事不愿意战斗，结果平分资源；如果群体中两个老鹰相遇并竞争有限的生存资源，由于它们都非常勇猛而相互残杀，直到双方受到重伤而精疲力竭，结果虽然双方都获得部分生存资源但损失惨重，入不敷出。假定竞争中得到全部资源为50个单位（该数字也可以表示为生物的适应度、繁殖成活率或后代数量）；得不到资源则表示其适应度为零；双方重伤则用来表示。于是老鹰、鸽子两种动物进行的资源竞争可以用一个对称博弈来描述，博弈的支付矩阵如下：

操作依赖于该群体的初始状态。如果初始时，该宿舍有多于4人使用操作系统，那么该宿舍所有学生最终都会使用该操作系统；否则所有学生最终会使用操作系统。

二、进化博弈理论的产生及其发展

进化博弈理论是经济学研究方法的一次创新，该理论从否定传统理论赖以成立的基础----理性人假定出发而建立起来一个新的分析框架，它结合了生态学、社会学、心理学及经济学的最新发展成果，从有限理性的社会人出发来分析参与人的资源配置行为。

2.1 理性的由来及其缺陷

经济学自从古希腊哲学中分离出来并成为一门系统的学问，是在亚当•斯密1776年发表《国富论》之后。以斯密为代表的古典经济学关注的核心是资源的稀缺程度如何能被人类经济活动所减少，他们关注的重点不是资源配置问题而是国民财富的增长及国别差异的原因。1890年马歇尔《经济学原理》的出版，标志着新古典经济学的成形，马歇尔之后，新古典经济学关注的核心逐渐转向在给定稀缺程度下资源的最优配置问题。稀缺资源的配置是需要人的参与，也就是说经济学研究的问题演变为关于经济中参与人如何把稀缺的资源配置到效率最高地方去的问题，强调个体行为在资源配置中的作用。经济中参与人的决策行为是通过高度复杂的思维活动作出的，为了更好地从微观个体行为来解释资源配置问题，新古典经济学借用了哲学中“理性”概念对复杂的人类行为过程进行了抽象的假定。然而，理性一词用于经济学时却对其含义的理解与哲学中对其含义的理解已经有了明显的区别。哲学中的理性是指人类所特有的用以探索自然和社会奥秘的认知能力，当代伟大的哲学家康德在其著作《纯理性批判》一书中指出，人类理性即认知能力并不是万能的，而是有限的。经济学中的理性则是指一种行为方式，具体地说即是经济中参与人对其所处世界的各种状态及不同状态对自己支付的意义都具有完全信息，并且在既定的条件下每个参与人都具有选择使自己获得最大效用或最大利润的能力。

经济学家认为理性是至高无上的，人们凭借理性就可以完全地认识自然与社会。经济学中对理性的含义经过这样的处理以后，就使得经济学能够充分运用数学理论发展的成果来进行分析。为了应用数学工具并更好地处理经济问题，传统经济学家们从偏好，信念及理性三个方面来界定经济主体的特征，其中信念就是个体认为不同结果将会出现的基于个体所获信息之上的条件概率。偏好则是基于不同结果的信念之上的序。理性是根据上述偏好及信念，个体获得最优决策的程度以及个体根据已经获得的信息来修正其信念的能力。这三个特征使得经济学研究的对象由现实人转向了理想化的对象，经济学越来越偏离了现实。

由理性概念而引致的缺陷首先表现在理性人具有无限的信息收集及处理能力的均衡观，认为经济系统常常处于均衡状态，非均衡只是一种暂时的现象，当受到外生因素扰动而使系统偏离均衡状态时，系统会以线性的方式回归均衡，这种机械式线性反应的均衡观来源于牛顿力学，由此而得出的比较静态分析法完全忽视了系统受到非线性扰动及连续因素的影响。其次表现在由全知全能的理性人而引致的均衡跳跃观，认为经济系统达到均衡或者从一个均衡到另一个均衡是不需要时间的，认为时间是可逆的，即经济变量与物理学的变量一样，只要条件相同系统的均衡也就相同，市场和经济对于过去的记忆是短暂的或者是没有的。这种应用经典牛顿力学分析方法来分析高度复杂的参与人经济行为使得其预测效果大打折扣。最后表现在其比较静态分析方法上，传统经济学的最基本分析方法----比较静态分析法赖以成立的基础是假定经济系统只受到外界一个个相互独立、互不重叠的冲击的影响，或者当一个因素的影响消除之后，下一因素才开始对经济系统产生影响。我们知道现实世界是普遍联系的，各种因素之间不可能相互独立，系统中任何一个因素的变动都会引起其他因素的变动，这些因素之间相互作用的时间可能很短也可能很长，各因素对最终目标会产生不同程度的影响。比较静态法却只见局部不见整体，企图通过比较不同均衡来找出系统达到均衡的条件，因此得不出符合现实的结论，其研究方法上的局限性大大降低了其理论的现实意义。

2.2 心理学研究成果及有限理性概念的提出

随着经济学家对理论研究的深入，特别近来实验经济学的迅速发展，主流经济学赖以成立的基础“理性人”假定及其基本的比较静态均衡分析法越来越受到了人们的质疑。相继出现了许多其他的研究方法，其中在经济学中影响最大的就是心理学的研究方法。心理学应用于经济分析有着非常曲折的历史。事实上，斯密、马歇尔、庇古、费雪尔和凯恩斯等一批古典经济学家都仔细地分析了偏好和信念的心理学基础。但从1940’s开始，一方面受到萨缪尔森及希克斯等新一派基于理性假定经济学家的影响，心理分析在经济学中的地位慢慢地被降低了；另一方面理性模型也遇到了许多如Allais(1952)悖论等难以给出合理解释的经济现象。于是1960’s开始，许多微观经济学家再次运用心理学研究方法来解释现实中的异常现象，宏观经济学也把经验法则和适应性预期纳入到其模型之中，正是在这一时期心理学家Simon(1957)提出了其著名的“有限理性”概念。然而，1970’s初随着Robert Lucas等人提出的理性预期理论、Selten、Kreps等倡导的强调正确信念及贝叶斯修正的博弈理论及Stiglitz、Spence等研究的信息经济学理论相继成为主流经济学的一部分，经济学界再一次掀起了排除渗透在经济学领域中心理学研究方法的热潮，心理的研究方法在经济学界几乎无立足之地，严格理性假定席卷整个经济学界。行为经济学的发起者Amos Tversky在经济学界根本找不到志趣相投者。1970’s末期，随着心理学家Amos Tversky与Kahneman合作发表了一系列应用心理分析方法来研究经济学问题的原创性文章，如1974年他们在Science发表的Judgment under uncertainty: Heuristics and biases，1979年他们合作在Econometrica发表Prospect theory: An analysis of decision under risk，慢慢消除了经济学界中存在的对心理学分析方法的偏见，此后应用心理分析方法来解释经济现象的文献见诸于各种经济学期刊之中，心理分析方法也渐渐地成为了主流经济学的研究方法之一。

进入1980’s，随着经典博弈理论、生态理论及心理学理论研究的深入发展，特别是心理学家西蒙把其在心理学领域研究的成果直接应用经济分析并因此获得了诺贝尔经济学奖，极大地激励着经济及社会学家从现实人行为出发来解释经济及社会现象。心理学研究表明人类认知过程首先表现为人们通过一种“感知秩序”进行学习活动，并形成分散的非同质的知识，其中“感知秩序”是指人的理解力、知识和人类行动之间的关系；其次表现为个体通过学习所达到的理性程度的有限性，组织学习个体学习行为的整合而形成的多层次“理性结构”，个体理性便会在一个累积性的组织或制度环境中得到塑造和提高并发挥作用，在这个过程中，个体学习行为总会受到组织、习惯和文化等制度性的限制和影响。西蒙认为人类并不是完全理性而是有限理性的，因为人类认知能力有着心理的临界极限，人类进行推理活动需要消耗大量的能量，推理也是一种相对稀缺的资源，另外决策者决策时需要大量的信息，而这些信息是不可能免费获得的，获得决策所需要的信息是需要大量成本的。考虑到参与人有限的知识水平、有限的推理能力、有限的信息收集及处理能力，经济主体的决策行为并非总是最大化的结果，其决策受到参与人所处的社会环境、过去的经验、日常惯例及其他人相似情形下的行为选择等因素的影响。在有限理性条件下，由于参与人无法免费获得决策所需要的全部信息，并且参与人即使获得了决策所需要的全部信息也可能由于有限的计算能力而无法得出最优决策。因此，参与人只能采取模仿、学习等简单的直观决策方法或一些固定的常规来进行决策。人类的决策结果受到复杂的认知过程的影响，不同的人或者同一个人在不同时间即使给出相同的条件也可能会得出不同的决策结果，即决策结果受到认知过程的路径影响。

2002年诺贝尔经济学奖得主之一心理学家丹尼尔·卡内曼(Daniel Kahneman)将源于心理学的综合洞察力应用于研究在不确定条件下参与人的决策过程及行为结果并展示了人为决策是如何异于标准经济理论预测的结果。在1979年，他与有着深厚数学及哲学背景的心理学家特韦尔斯基（Tversky）提出了震撼经济学界的“前景理论”(Prospect theory)。他们的发现激励了新一代经济学研究人员运用认知心理学来研究经济学，使经济学的理论更加丰富。一个理论获得诺贝尔经济学奖不仅是对获奖者过去成就的肯定，更主要说明了获奖理论将会成为主流经济学未来的发展方向。2002年诺贝尔经济学奖授予给丹尼尔·卡内曼标志着经济学的研究对象从传统的“经济人”转向现实的“社会人”，经济学直面现实。如何从有限理性出发来研究参与人的行为，许多经济学家对之进行了广泛而深入的研究并提出了许多理论，在这些理论之中影响最大且受到了经济学界普遍接受的理论即进化博弈理论。

2.3 进化博弈理论的产生及其发展

进化博弈理论源于对生态现象的解释，1960年代生态学家Lewontin就开始运用进化博弈理论的思想来研究生态问题。生态学家从动植物进化的研究中发现，动植物进化结果在多数情况下都可以用博弈论的纳什均衡概念来解释。然而，博弈论是研究完全理性的人类互动行为时提出来的，为什么能够解释根本无理性可言的动植物的进化现象呢？我们知道动植物的进化遵循达尔文“优胜劣汰”生物进化理论，生态演化的结果却能够利用博弈理论来给予合理的解释，这种巧合意味着我们可以去掉经典博弈理论中理性人假定的要求。另外，1960年代生态学理论研究取得突破性的进展，非合作博弈理论研究成果也不断涌现并日趋成熟，进化博弈理论具备了产生的现实及理论基础。

进化博弈理论应用于研究经济学问题在学术界曾经引起极大的争议，争论的焦点在于理性假定。当时由于理性概念在经济学界已经根深蒂固。多数人认为利用研究生态演化的进化博弈理论来研究参与人的行为是不合适的。因为动植物行为是完全由其基因所决定的，而经济问题则涉及到具有逻辑思维及学习、模仿能力的理性参与人的行为，因此，借助于进化博弈理论来研究远比动植物复杂的人类行为显然是行不通的。但随着心理学研究的发展及有限理性概念的提出，越来越多的经济学家应用进化博弈理论来解释经济现象并获得了巨大的成功，利用进化博弈理论来研究并解释经济现象的文献大量出现于各种经济学期刊了。尽管如此，利用进化博弈理论来解释经济现象还是需要对该理论的基本分析框架作出相应的调整。如果去掉参与人偏好、信念及理性假定等条件，那么参与人是如何作出决策的呢？进化博弈理论在处理有限理性参与人决策问题时，常常假定参与人遵循某种比贝叶斯法则更简单的行为规则，这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择，这样参与人只要知道什么会发生，而不必知道为什么会发生。

1970年代，生态学家Maynard Smith and Price（1973）结合生物进化论与经典博弈理论在研究生态演化现象的基础上而提出了进化博弈理论的基本均衡概念----进化稳定策略（Evolutionarily stable stragegy ESS），目前学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后，生态学家Taylor and Jonker（1978）在考察生态演化现象时首次提出了进化博弈理论的基本动态概念----模仿者动态（Replicator Dynamics）。至此，进化博弈理论有了明确的研究目标。

1980年代以后，随着新古典经济学及博弈论固有的缺陷逐渐被人们所认识，有限理性概念得到了学术界的普遍认可，加之进化博弈理论在解释生态现象时获得的巨大成功，特别是经济学界于1992年在康奈尔大学召开的进化博弈理论学术会议，正式确立了该理论的学术地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等经济学家从不同的角度对传统的进化博弈理论分析框架进行拓展，并使之逐渐转化为描述经济行为的理论。目前，进化博弈理论的基本理论体系虽然已经形成但还是相当粗糙。因此，它仍然处于不断发展和完善的阶段，但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法，从而得到了越来越多的经济学家、社会学家、生态学家的重视，我们有理由相信该理论成为主流经济学的一部分已经为时不远。

三、进化博弈理论的基本内容

进化博弈理论结合经典博弈理论及生态理论研究成果，并以有限理性的参与人群体为研究对象，利用动态分析方法把影响参与人行为的各种因素纳入其模型之中，并以系统论的观点来考察群体行为的演化趋势。

进化生态学与博弈论的结合至少已有三十几年的历史，初看起来使人觉得奇怪，因为博弈论常常假定参与人是完全理性的，而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人，用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略，那么这两种理论就达到了形式上的统一。尽管这两种理论在形式上达到了统一，但进化博弈理论与经典博弈理论还是存在本质区别。在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈，他们没有特定的博弈对手 ④。在这种情况下，参与人既可以通过自己的经验直接获得决策信息，也可以通过观察在相似环境中其他参与人的决策并模仿而间接地获得决策信息，还可以通过观察博弈的历史而从群体分布中获得决策信息。对参与人来说，观察群体行为的历史即估算群体分布是非常重要的，首先，群体分布包含了对手如何选择策略的信息。其次，通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策略。参与人常常会模仿好的策略⑤ 而不好的策略则会在进化过程中淘汰，模仿是学习过程中的一个重要组成部分，成功的行为不仅以说教的形式传递下来，而且也容易被模仿。参与人由于受到理性的约束而其行为是幼稚的（Naive），其决策不是通过迅速的最优化计算得到，而是需要经历一个适应性的调整过程，在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此，系统均衡是达到均衡过程的函数，要更准确地描述参与人行为就必须考察经济系统的动态调整过程，动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。

3.1 进化博弈理论基本模型分类

进化博弈理论的基本模型按其所考察的群体数目可分为单群体模型(Monomorphic Population Model)与多群体模型(Polymorphic Populations Model)。单群体模型直接来源生态学的研究，在研究生态现象时，生态学家常常把同一个生态环境中所有种群看作一个大群体，由于生物的行为是由其基因唯一确定的，因而可以把生态环境中每一个种群都程式化为一个特定的纯策略。经过这样处理以后，整个群体就相当于一个选择不同纯策略（纯策略集的数目就相当于群体中的种群数）的个体。群体中随机抽取的个体两两进行的都是对称博弈，有些文献中称这类模型为对称模型（Symmetry model）。严格地说，单群体时个体进行的并不是真正意义上的博弈，博弈是在个体与群体分布所代表的虚拟参与人之间进行。如第一部分的老鹰----鸽子博弈，该生态环境中有两个种群老鹰与鸽子，它们代表两个不同的纯策略，用进化方法进行处理时认为该生态群体中每个个体都有两种可供选择策略即老鹰策略与鸽子策略，此时的博弈并不是在随机抽取的两个个体之间进行，而是每个个体都观察群体状态（选择老鹰策略与鸽子策略个体数在群体中所占的比例），给定此状态它就可以计算自己选择不同策略所得的期望支付（严格地说这并不是期望支付，但为了说明的方便本文仍然借用该概念）进而确定选择哪一个策略不选择哪一个策略，对物种而言这就意味着种群数量的增加或减少。

多群体模型是由Selten (1980)首次提出并进行研究的，他在传统单群体生态进化模型中通过引入角色限制行为（Role Conditioned Behavior）而把对称模型变为了非对称模型。在非对称博弈个体之间有角色区分，此时可以从大群体中区分出不同的小群体，群体中随机抽取的个体之间进行真正意义上的两两配对重复、匿名非对称博弈，有时又称之为非对称模型（Asymmetry model）。如果我们把系统选择博弈中的宿舍变成学校（整个学校相当于一个大群体）而把十个人变成十个班（每一个班看成是一个小群体，且同一班的同学无角色区分即与单群体情形一样），每个班的学生都有多种选择，此时该校学生所进行的计算机系统选择博弈就是非对称博弈。非对称博弈模型并不是对单群体博弈模型的简单改进，由单群体到多群体涉及到一系列的如均衡及稳定性等问题的变化。Selten(1980)证明了“在多群体博弈中进化稳定均衡都是严格纳什均衡⑥ ”的结论，这就说明在多群体博弈中，传统的进化稳定均衡概念就显示出其局限性了。同时，在模仿者动态下，同一博弈在单群体与多群体时也会有不同的进化稳定均衡。

按照群体在演化过程中所受到的影响因素是确定性的还是随机性的，进化博弈模型可分为确定性动态模型和随机性动态模型。确定性模型一般比较简单并且能够较好地描述系统的演化趋势，因而，理论界对之进行较多的研究。随机性模型需要考虑许多随机因素对动态系统的影响，一般比较复杂，但该类模型却能够更准确地描述系统的行为，近年来理论界对之也进行广泛的探讨[对随机动态的详细讨论可以参阅这方面的经典文献Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。

3.2 进化博弈理论基本均衡概念-----进化稳定策略

进化博弈理论的基本均衡概念---进化稳定策略⑦ [文献2、5有详细介绍]是由Maynard Smith and Price（1973）及Maynard Smith(1974)在研究生态演化问题时提出来的，其直观思想是：如果一个群体（原群体）的行为模式能够消除任何小的突变群体，那么这种行为模式一定能够获得比突变群体高的支付，随着时间的演化突变者群体最后会从原群体中消失，原群体所选择的策略就是进化稳定策略。系统选择进化稳定策略时所处的状态即是进化稳定状态，此时的均衡就是进化稳定均衡。下面给出Maynard Smith and Price（1973）对进化稳定策略的定义（此后本文称之为原初定义），用符号表示如下：

说是进化稳定策略，如果，存在一个<，不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵；y表示突变策略；是一个与突变策略y有关的常数，称之为侵入边界（Invasion Barriers）；表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。实际上相当于该吸引子对应吸引域的半径，也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质，而落于吸引域范围之外是不考虑的，所以说它只能够描述系统的局部动态性质。至于系统是如何进入吸引域的原初的进化稳定策略定义所没有给予足够的重视。

要准确地理解进化稳定策略概念就必须正确理解突变者和侵入边界的含义。我们可借助于前面的两个例子来理解。在老鹰、鸽子博弈中，当该生态环境中只有老鹰（或只有鸽子）时，这时系统已经处于均衡状态，但它们都是不稳定的均衡，因为这两个均衡都可以被突变者侵入。开始时，假定该生态环境处于老鹰均衡，如果由于某种原因而进入鸽子时，那么随着时间的演化，整个生态系统最终就会稳定于一半为老鹰一半为鸽子的状态，即混合策略纳什均衡是进化稳定的。这说明该博弈中两个纯策略纳什均衡是不稳定的。因为，当系统处于纯策略所表示的状态时，只要存在突变者系统就会离开这种状态，所以它们都不是进化稳定的。相反混合策略纳什均衡却不一样，即当系统处于一半是老鹰一半是鸽子时，如果由于某种因素使得系统偏离该状态，那么系统会自动恢复到原来状态。另外，在系统选择博弈中突变者、侵入边界就更为明显，所谓突变者即是指选择进化稳定策略以外的策略者，且侵入边界与不同的均衡有关。该博弈有两个纯策略纳什均衡和一个混合策略纳什均衡（），前一个均衡所对应的侵入边界就是，也就是说如果选择操作系统的学生数占群体总数的比例大于（即学生数大于4），那么选择操作系统的突变者就不可能侵入到该群体中，如果选择操作系统的学生数占群体总的比例小于（即学生数小于4），那么选择操作系统的突变者就会侵入到该群体中而原来选择操作系统的学生会转而学习操作系统。

最初进化稳定策略定义有比较苛刻的条件限制，如单群体、群体中个体数目无限大、系统只受到不连续且互不重叠冲击的影响等。这些条件大大地限制该定义的应用，随着学术界对进化博弈理论研究的深入，许多理论家们从不同的角度对最初定义进行了拓展，如Selten 1980首次给出了适应于描述多群体均衡的定义；Schaffer 1988首次给出了适应于描述有限规模群体的均衡定义；Foster and Young（1990）首次给出了适应于描述连续随机系统的均衡定义等等（有关对进化稳定策略进行拓展的讨论见文献[5]）。最初定义是在解释生态现象时提出来的，如果进行经济分析，时需要进行相应的改变。在分析生态现象时，把每一个种群的行为都程式化为一个策略，因此进化的结果将会是突变种群的消失（消失的原因在于生物的行为是由其遗传基因唯一确定的）。如果用于经济分析，那么进化的结果将是那些选择突变策略的个体最终会改变策略而选择进化稳定策略（因为人类可以通过学习、模仿等来改变自己所选择的策略）。

经典博弈理论中的核心概念纳什均衡即是指一种策略组合，在该策略组合下任何个人单独偏离都不会变得比不偏离好。纳什均衡是一个静态概念，不能描述系统的动态性质，用数学语言来说它是动态系统的不动点，纳什的成功就是在于他应用拓扑学的不动点定理证明了纳什均衡的存在性。进化稳定策略必定是纳什均衡策略，它是纳什均衡的精练，文献[3]对此有详细的介绍。在进化稳定策略的定义中引入突变者及侵入边界使之能够更好地描述系统的局部动态性质。第一部分的两个例子中，按照纳什均衡的概念是无法得知两个系统最终会选择哪一个均衡，但利用进化稳定策略却可以说明系统最终会稳定哪一个均衡并可以分析系统达到不同均衡的条件，在某种程度上，较好地解决了多重均衡选择问题。

3.3 进化博弈理论基本动态概念----模仿者动态

进化博弈理论来源于生态学的研究，该理论基本上从“优胜劣汰”的进化论观点来看待群体行为的调整过程。一般的进化过程都包括两个可能的行为演化机制：选择机制(Selection Mechanism)和突变机制（Mutation mechanism）。选择机制是指本期中能够获得较高支付的策略，在下期被更多参与者选择；突变是指参与者以随机（无目的性）的方式选择策略，因此突变策略可能获得较高支付也可能获得较低支付，突变一般很少发生。新的突变也必须经过选择，并且只有获得较高支付的策略才能生存（Survive）下来。进化博弈理论需要解决的关键问题就是如何描述群体行为的这种选择机制和突变机制。博弈理论家对群体行为调整过程进行了广泛而深入的研究，由于他们考虑问题的角度不同，对群体行为调整过程的研究重点也就不同，因而提出了不同的动态模型，如Weibull(1995) 提出的模仿动态（Imitation Dynamics）模型，认为人们常常模仿其他人的行为尤其是能够产生较高支付的行为；Börgers and Sarin(1995，1997)等提出并应用强化动态（Reinforcement Dynamics）来研究现实中参与人的学习过程；Skyrms (1986) 引入了意向动态（Deliberational Dynamics）模型对哲学中的理性问题进行了讨论；Swinkels(1993)提出了近似调整动态（Myopic Adjustment Dynamics）；Borgers and Sarin(1995)提出了刺激—反应动态（Stimulus-Response Dynamics）等等。到目前为止，在进化博弈理论中应用得最多的还是由Taylor and Jonker(1978)在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态（Replicator Dynamics）。所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。下面就给出Taylor and Jonker（1978）提出的模仿者动态的微分形式：

化的而且因素之间的互动作用也是需要时间的。因此，均衡只是一种暂时现象或者在多数情况下，系统根本不可能达到的现象，要更准确地考察参与人的行为就必须运用系统论的观点，把行为互动性、因素互动性及时间因素纳入到其模型之中。

5.2 经典博弈理论的策略互动分析法及其缺陷

考虑到新古典经济学没有把参与人行为之间的互动关系纳入到其模型之中，经典博弈理论则在理性人假定的基础上把参与人行为的互动关系纳入到其模型之中进一步考察了参与人的决策问题。在我国，对人类互动行为的研究至少可以追溯到三国时期田赛马的故事，但作为一种正式理论提出来，一般认为是始于冯·诺意曼和摩根斯藤（Von Neumann and O. Morgenstern, 1944）出版的《博弈论与经济行为》一书，直到纳什（Nash 1950）在研究非合作博弈的基础上提出著名的纳什均衡（Nash Equilibrium）概念才使得博弈论成为一门完整的理论。经过近五十年的发展，终于在1994年，三位杰出的博弈论大师：纳什（John F. Nash）、泽尔藤（Rechard Selten）和海萨尼(John C. Harsanyi)获得了经济学的最高荣誉——诺贝尔经济学奖，在全球经济学界再次掀起了对博弈论的研究热潮。经典博弈论为社会科学提供了一个新的研究视角，使我们能够以全新的方法来处理各种冲突与合作的问题。博弈论作为一种理论工具，其应用相当广泛。在信息经济学中得到了充分的应用，1996年诺奖得主Mirrlees等、2001年诺奖得主Akerlof等都对信息经济学研究作出了卓越的贡献。这充分说明了博弈论在经济学的地位可见一斑。

经典博弈理论的核心概念----纳什均衡就是由普林斯顿大学数学家纳什在研究非合作博弈时提出来的。纳什均衡即是指给定其他参与人选择的情况下，每一个人单独偏离均衡都不会变得比不偏离好，显然纳什均衡是一个静态均衡概念。经典博弈理论尽管把参与人的互动行为引入到其模型之中，并认为现实中参与人不是孤立地作出自己的决策，每一个参与人的决策不仅依赖于其自身所面临的条件及其所拥有的信息，而且也依赖于其他参与人的决策选择。但该理论却面临着其自身无法克服的缺点。首先，博弈论中的互动是一种“沉默互动⑨ ”，这种互动不允许参与人之间存在任何形式的交流，即假定参与人都是一个个只会理性计算的孤立经济人而非社会人，一旦引入社会互动，许多博弈都无法进行分析，也就是说经典博弈理论中的互动并不“社会互动”而是孤立的“沉默互动”。其次，博弈论的基本均衡概念纳什均衡要求博弈各方都是理性的，并且理性是共同知识，博弈时如果某一方选择了非理，那么博弈就无法进行下去。特别地该理论在利用后向归纳法（Backward Induction）对纳什均衡进行精练时，不但要求参与人完全理性，而且还要求参与人的行为满足序贯理性（Sequential Rationality）要求。这一比理性更强的要求使得博弈论更加远离现实人。再次，在处理参与人所面临的不确定性时，不仅要求各参与人知道世界的各种状态，而且要求参与人知道每一种状态所出现的概率，并且给定一个先念信念，当出现任何新信息时，每个参与人都能够应用贝叶斯法则修正自己的先念信念，也就是说参与人不但具有很强的计算、推理能力，而且能够在一个大的状态空间上应用贝叶斯法则解决相当复杂的问题。现实中多数情况下，参与人并不都具有这种计算、推理能力。最后，博弈论碰到了其最棘手的问题就是多重均衡的处理，当博弈出现多重均衡特别是多重严格纳什均衡时，尽管许多理论家提出了一些方法（Selten（1965）提出的子博弈精炼纳什均衡概念，Selten（1975）提出的颤抖手精练纳什均衡，Kerps—wilson(1982)提出的序贯均衡，Schelling（1960）提出的聚点均衡等）来处理多重均衡问题，但始终没能获得一致认可的结论。

与新古典经济学相比，经典博弈理论虽然在其模型中纳入了行为的“沉默互动”关系，但该理论给出的研究方法仍然没能跳出新古典经济学的均衡分析框架，这种只注重结果而忽略达到结果的过程的分析方法依然把对经济系统的影响因素都看作为一个个孤立因素，依然认为影响因素与决策结果是一一对应的关系，依然没能把参与人所处社会环境等因素纳入到其模型之中，因而不能准确地描述现实中人的决策行为，其结论也仅仅具有理论意义而缺乏政策含义。

5.3 进化博弈理论局部动态分析方法的现实性

进化博弈理论利用达尔文“优胜劣汰”的生物进化论、经典博弈理论并结合心理学的研究成果，从西蒙提出有限理性（Bounded Rationality）的参与人群体出发，通过对群体行为的研究进一步得出参与人个体的行为。进化博弈理论跨越了完全理性的“经济人”与有限理性的“社会人”的鸿沟，实现了经济学研究方法革命性的突破。与传统均衡分析法相比，进化博弈理论的局部动态分析方法在以下几个方面独具特色。

5.3.1 局部动态分析法的均衡观

传统的均衡分析方法认为完全理性参与人能够对环境的任何变化作出迅速的最优反应，因而，经济系统是常常处于均衡状态的，分析参与人的行为只需要研究均衡结果，并以此来预测经济人的行为，通过比较不同均衡结果来寻找系统达到均衡的条件。这种处理方法为了数学上处理的方便而撇开现实中“因素互动”而分别考察单个因素对均衡的影响，使得理论更加缺乏现实基础。进化博弈理论则完全摒弃传统理论中非现实的“理性人”假定，直接从有限理性参与人群体出发而提出的一种全新的研究方法----局部动态法。局部动态法把经济系统达到均衡结果的过程纳入到其模型之中，认为经济系统达到均衡需要一个长期的渐进过程，均衡结果依赖于达到均衡的过程，也就是说任何一个结果都是路径依赖的，它与混沌经济学完全动态的研究方法具有某种程度的相似之处。

5.3.2 局部动态法的时间观

传统的均衡分析法并没有纳入因素互动关系并且理性计算是不需要时间的，所以得出经济系统常常是均衡的结论。进化博弈理论的局部动态法一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中，强调系统达到均衡的过程，并认为经济系统由于受到各种互动行为及互动因素的影响，有些系统达到均衡可能只需要很短的时间，有些系统达到均衡可能需要很长的时间，有些系统可能无法达到均衡。时间因素对经济学研究有着非常重要的意义，如均衡分析法无法考虑宏观经济政策中“时滞”使得许多实施时有效的政策在发生作用时却出现了与原意相反的结果。时间是度量政策效率的一个很重要的因素，如果不考虑时间因素有些政策可能很有效率，但纳入时间因素，一些需要太长时间才能使系统达到意愿均衡的政策可能根本就没有效率。进化博弈理论把时间纳入到模型分析中并充分应用数学中的相图来描述经济系统达到均衡的路径，这样有利于决策者控制经济系统使之朝向既定的目标前进，也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素，使系统尽快达到有效率的均衡。

5.3.3 局部动态法的均衡选择观

新古典经济学研究的逻辑有理性就有均衡，然后在既定均衡下通过对不同均衡的比较来寻找系统达到不同均衡的条件，即比较静态法，最后结合条件找出希望达到的均衡，因此，该理论不存在真正意义的均衡选择问题。经典博弈理论提供的分析方法在多数情况下都存在其自身所无法处理的多重均衡问题。如老鹰与鸽子博弈及系统选择博弈中多重均衡问题。进化博弈理论的局部动态法引入突变因素就能够较好地解决了多重均衡的选择问题，在老鹰与鸽子博弈中，尽管全是老鹰（全是鸽子）都是均衡的，但这两个均衡都极不稳定即都不是进化稳定均衡，一旦有鸽子（老鹰）突变者进入该系统就会使系统偏离，随着时间的推移而使得系统趋向于混合策略进化稳定均衡即一半鸽子一半老鹰（该均衡是一个全局吸引子）；在系统选择博弈中经典博弈理论无法解释系统最终会趋于哪一个均衡，局部动态法引入了突变因素就能够很好地解决了均衡选择问题，即系统最终会趋于哪一个均衡依赖于系统的初始状态即路径依赖。进化博弈理论的基本均衡概念----进化稳定均衡描述的是当经济系统一旦进入到某一均衡的吸引域内时，系统就会对其他的突变策略具有一定程度（即在突变边界内）的抵抗力。

5.3.4 局部动态法的特殊性

新古典经济学与经典博弈理论均衡分析法都是以单个消费者、单个生产者、单个市场为研究对象来考察参与人的最优决策行为，并由此研究整个社会的资源配置问题。然而它们却碰到了如何由个体行为转化到群体行为的困难，因为这种转化过程涉及到各种互动因素的影响。一个明显的例子是经典博弈理论中囚徒困境博弈，在该博弈中两个囚徒都从个体理性出发，但得到了集体非理性均衡的结论。也就是说，均衡分析法根本无法实现从个体行为向集体行为的过渡，在此框架内寻找宏观经济的微观基础的困难是非常大的。进化博弈理论的局部动态法则从人的社会性出发，利用系统论的处理方法来看待参与人的决策行为。该理论直接以参与人的群体为其研究的逻辑起点，在考虑到影响参与人行为的社会因素、文化因素、民族习俗及个体生活习惯等因素的基础上进一步考察群体中有限理性个体的行为互动关系，很巧妙地避开由个体行为向集体行为转化问题，因而能够更加真实地反应现实人的决策过程及其决策结果。

六、结论

进化博弈理论是经济学领域的前沿理论，它来源于对生态现象的研究，虽然该理论应用于经济分析的时间不长，但它为经济学研究提供了一个全新的分析方法，较好地克服了新古典经济学及经典博弈理论中理性假定及多重均衡的困难。并且，应用进化博弈理论来研究经济系统能够获得比传统理论更准确的结果，能够更加现实地解释经济现象，因而在短期内为多数经济学家所接受。从某种意义上说引入进化博弈理论局部动态法来分析经济中参与人的行为是经济学研究方法的一次创新。

注释： ①本文把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈理论。 ②即无性生殖，这样假定的意思就是说后代继承其母体的策略，并且永远不改变，当然用于研究人类的行为时，需要作相应的调整。 ③所谓近视调整即是指参与人不管未来怎么样，只知道使当前的支付最大化 ④ 经典博弈理论中每一个参与人都有特定的博弈对象，并且，在重复动态博弈中，后行动者通过观察先行动者的理而利用贝叶斯法则来修正自己的先念信念，然后，在此信念下选择使自己获得最大支付的策略。 ⑤好的策略即是指能够获得较高支付的策略。 ⑥所谓严格纳什均衡即是严格占优纳什均衡。给定对手选择的情况下，每个人都通过选择严占优的策略而组成的纳什均衡。 ⑦事实上，这与Selten提出的颤抖手均衡概念具有相似性，所谓颤抖手均衡是指一个战略组合，只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优战略的组合时才是一个均衡，其严格定义可以参阅张维迎的《博弈论与信息经济学》。其中的颤抖或者犯错误与进化稳定策略中的突变因素有差不多的含义，但它们之间存在本质上的不同。 ⑧由模仿者动态方程进行支付变换，可得。 ⑨这一点我们可以从博弈论一个著名的捐款----回赠实验中看出，募捐者要求每一个人都自愿捐款，最终募捐者以3倍于捐款总额的钱平均分派给每个捐款者，为了使得博弈能够分析下去，募捐者要求自愿捐款时每个人都不得与其他人讨论，否则该博弈就无法进行下去，因此，本文称博弈论中的互动是一种沉默互动而非社会互动。这个实验充分体现了古典经济学及博弈论研究对象上的一致性，即它们都是研究单个个体的行为而排除了人的一个重要特征----社会性。参考文献

[1] 王则柯（1999）：《博弈论平话》，中国经济出版社。

[2] 张维迎（1999）：《博弈论与信息经济学》，上海三联出版社。

[3] 张良桥，冯从文（2001）：《进化稳定均衡与纳什均衡：兼谈进化博弈理论的发展》，《经济科学》，3，103-111。

[4] 张良桥（2001）：《理性与有限理性：论经典博弈理论与进化博弈理论之关系》，《世界经济》，8，74-78。

[5] 张良桥（2003）：《论进化稳定策略》，《经济评论》，2，70-74。

[6] 张良桥，郭立国（2003）：《论模仿者动态》，《中山大学学报自然科学版》，3。

[7] 杨小凯（2000）：《新兴古典经济学和超边际分析》，中国人民大学出版社。

[8] 青木昌彦, 奥野正宽(1999):《经济体制的比较制度分析》, 魏加宁等译, 北京: 中国发展出版社.

[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.

[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.

[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.

[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.

[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.

[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.

[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.

[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.

[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.

[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.

[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.

[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.

[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.

[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.

[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.

[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.

[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.

[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.

[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.

[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.

[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.

[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.

[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.

[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.

[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.

[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.

[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.

[40] Weitzman, Martin(1984): The Share Economy.Cambridge, Harvard University Press.

第2篇

一、“囚犯悖论”与会计舞弊行为模型构建及分析

（一）会计舞弊行为模型构建。A、B两同谋嫌疑犯被警察抓获并分别关押审讯。条件：(1)两人不能互通信息，个人只能在收益最大、损失最小的原则下做出招与不招的选择；(2)暂不考虑价值判断。法官告诉他们：①两人均招供，各判刑三年；②两人均抵赖，各判刑半年(或许因证据不足)；③如一人招供，一人抵赖，招供者释放，抵赖者重判五年。模型如下：

这是博弈支付矩阵，每格第一个数字是A的支付，每格第二个数字为B的支付。即矩阵第一行3，0为A选择招供的付出，第二行5，0.5为A选择抵赖的付出；矩阵第二列3，0为B选择招供的付出，第四列5，0.5为B选择抵赖的付出。假如B抵赖，A招供就被释放，抵赖判刑半年，A招供比抵赖好；假如B招供，A招供判刑三年，抵赖判刑五年，A招供比抵赖好。同样，B也是如此。可见，无论对方如何选择，个人的最优选择都是招供。由于受条件限制，二人均选择了招供，被判刑三年，因为他们都不愿承担自己抵赖而别人招供的风险，这种选择只能在收益最大、损失最小的原则下作出。但因双方抵赖才判刑半年，显然招供的选择不是最好的，这就是经典博弈论中的“囚犯悖论”。

据此，我们来构建一个会计人员行为选择的“囚犯困境”。假设甲乙两个企业会计人在提供会计信息时有两种选择：如实做账(合法)、弄虚作假(违法)。模型如下：

甲如何选择：如果乙如实做账，甲弄虚作假可比如实做账多获取3个利益单位(4-1=3)；如果乙弄虚作假，则甲弄虚作假比如实做账多获取1.5个(2-0.5=1.5)个利益单位。无论乙做不做假，甲弄虚作假都比如实做账获利大，因此从个人理性出发，必然选择违法行为而作假账。乙也同样如此。结果大多企业“不造(假)白不造”，弄虚作假泛滥成灾，成为一种社会普遍选择。因此，从经济学角度看，舞弊行为的发生是舞弊者的理性选择。

（二）会计舞弊与制假行为博弈分析。我们试分析一下，会计作假行为究竟需要“付出”什么呢?即应承担的舞弊成本，主要有：实施过程中所付出的物质耗费，几乎为零；实施舞弊行为造成的后果及被有关部门追究受到制裁、惩罚，这是法律规定的违法行为应承受的代价，经济方面具体有：其行为受到某些限制，如吊销营业执照、生产许可证，停业、整顿、解散等处罚；给国家、社会、个人造成的财产或其他损失，应当以财产或其他经济利益给被损害者以补偿；经济信誉受到的损失。其他还有如行为人、责任者受到的各类法律责任的追究。以上这些付出用C表示。“产出”呢，则是通过舞弊行为谋取的各种不正当经济、政治利益，用B表示。舞弊行为一旦被严厉查处而受到惩罚的付出的全部应为-(C+B)，用q表示舞弊的被追究率，其关系如下：

弄虚作假的期望收益：

-（C+B）q+B（1-q）=（-2B-C）q+C+C

如实做账的期望收益(谋取的不正当利益为0)：0×q+0×（1-q）=0

当期望收益（-2B-C）q+C>0，选择弄虚作假；当期望收益（-2B-C）q+C

二、会计舞弊产生的原因

会计舞弊同个人舞弊产生的前提相似。根据美国舞弊审核师协会的研究，形成会计舞弊必须满足三个前提条件：（1）存在舞弊动机；（2）存在舞弊机会；（3）事后被发现的可能性很小。

（一）经济利益驱动是产生会计舞弊的内部动因和根源。正所谓“天下熙熙，皆为利来；天下攘攘，皆为利往。”任何社会现象的背后，都有其深刻的经济利益根源，这也符合古典经济学的“经济人假定”。“经济人”在一切经济活动中的行为都是合乎所谓的理性的，力图以最小的经济代价去追逐和获得自身的最大经济利益。这里所讲的“利益”既包括单位利益，也包括单位领导、会计人员及其他相关人员的个人利益。因此，经济利益是最为常见的造假动机，是造假者最强大的内在驱动力，造假者通过造假旨在得到直接的或间接的、现实的或潜在的经济利益，另外对政治利益的追逐和强烈的虚荣心也使造假者铤而走险，不顾后果。

（二）造假环境促进了会计舞弊的产生。会计造假环境是指造假发生、发展的客观背景、前提条件和特定时期及机遇，是会计造假存在的空间和生长发育的土壤。会计造假与其所处的环境存在着紧密联系，假账总是生成于一定时间和空间之中，且对其存在着一定的依存关系，并随着社会经济发展的大环境和单位内部管理的小环境的变化而不断发展变化。

目前，我国市场秩序不规范、现代企业制度尚未完全建立、产权关系尚未理顺、国有资本“所有者缺位”、国有企业“内部人控制”的问题严重、不健全的法人治理结构无法对经营者形成有效的约束和监督机制。加之会计准则体系还不够完善，受准则的广泛适用性和准则本身某些既定原则的影响，会计处理的随意性也比较大。有研究表明，我国上市公司广泛存在着利用包括通过会计政策选择在内的手段操纵会计利润的现象。而在监管过程中主要问题是重“单一”监管、轻“综合”监管；重“硬性”监管、轻“柔性”监管；重行政制裁，轻民事赔偿。在现行的会计服务市场上，由于“内部人控制”现象泛滥，审计的独立性难以保证，注册会计师失去了应尽的职责。

三、惩治会计舞弊几点建议

（一）提高人员素质。各级会计工作管理部门、单位负责人要重视和做好会计职业道德教育工作。即：职业基础教育――敬业、爱业、乐业、勤业、精业；服务宗旨教育――为人民服务，为广大群众服务；职业精神教育――廉洁奉公、实事求是、客观公正、一丝不苟、严谨细致、忠于事业、无私奉献；遵纪守法教育――依法办事。

（二）加强法制建设。从法律制定方面看，其成本的设定应能有效地遏止舞弊行为的发生，足以补偿受害方面的损失，体现社会的公正制裁，补偿社会经济秩序所遭受的侵害。我们知道美国的法律多如牛毛，但是量化的多、抽象的少，实际应用中简洁高效。我们也应该遵循市场经济的规律，增加量化标准减少原则性、抽象性的条款。例如，“重大损失”、“恶劣影响”、“性质特别严重”等词语在落实上就很含糊，可谓见仁见智。到底损失多少款项为“重大”?影响多大范围算“恶劣”?严重到什么程度称“特别”?各人都有自己的看法，而且不尽相同。再有就是像“应(该)……”、“禁止……”之类的条款，这原本没有语病，但是，它往往缺少下文。规定某一事务应该或不能怎样做，但没有涉及行为人不这样做或已经做了要承担的具体后果，这种条款也只是徒具形式而已。

第3篇

关键词：社会两难；公共品博弈；实验经济学；条件合作者；搭便车者；货币性惩罚；非货币性惩罚；非惩罚机制；性惩罚

中图分类号：F062.6　文献标志码：A 文章编号：1674-8131（2013）01-0059-11一、引言

十报告指出：“坚持一切从实际出发，……统筹各方面利益关系，充分调动各方面积极性，努力形成全体人民各尽所能、各得其所和谐相处的局面。”要构建和谐社会，形成和谐相处的局面，核心是妥善协调好各方利益。改革开放三十多年来，我国在经济高速发展、城乡居民生活极大改善、综合国力大大增强的同时，诸如收入分配的不平等程度加剧、城乡差别扩大、区域发展不平衡等一些深层次的矛盾也逐渐暴露。在现阶段，我国社会成员利益多元化，如何协调不同阶层、不同群体间的利益，如何促使不同阶层、不同群体相互合作，使整个社会资源达到合理配置，是一个很值得研究的问题。

我国不同地区或群体间存在共同的利益，但又有本地区或群体自身的利益，有时候这种共同利益和自身利益是相互冲突的，因此如何协调各方利益是一个重要的问题。群体成员的合作行为才最符合群体利益，是群体最优行为；但个体倾向于选择“搭便车”的行为。例如所谓的“公共地悲剧”，若按新古典经济学的“经济人假设”，所有农民都只考虑自身的利益来决定放牧数量，这将会将导致草地资源被过度使用，最终所有农民的利益都将受损。这种以经济主体暂时得利，但造成整个社会资源枯竭的“社会两难”现象在社会冲突中比比皆是，如团队生产活动、污水排放、公共品供给等。如果我们能够提高这些社会两难中决策者的合作水平，那么对于提高团队竞争力、减少污水排放、增加公共品的供给，对于构建和谐社会都具有重要的意义。

在经济学实验研究诺贝尔经济学奖得主诺斯认为，现代经济学的研究方法有三种：历史的思辨的方法、实证的方法和实验的方法。实验经济学是在可控条件下应用实验方法研究经济学问题的经济学新分支，在某些情况下，实验方法有前两种方法不可替代的作用。　中，主要是采用公共品博弈实验来分析这些社会两难中的合作问题。一个简单、典型、基准的公共品博弈实验的内容是：n个被试可以在私人账户和公共账户中分配E元的实验货币称为初始禀赋，其数值由实验主持者设定，多数实验的初始禀赋为20、40或100。　。如果贡献给公共账户X元，产生的收益为n名被试贡献给公共账户的钱加总乘以k，再平均分给每个人k/n称为边际资本收益（marginal　per　capita　return，MPCR），由实验主持者设定，多数实验该值为0.3、0.5或0.75。　。投资私人账户的钱为E-X元，产生E-X元的收益。这样，每个被试的总收益为公共账户收益与私人账户收益之和。根据新古典经济学的观点，实验环境提供了良好的搭便车的机会。公共品博弈实验早期的研究主要包括Bohm（1972，1983）、Dawes（1980）、Dawes等（1977，1986）、Orbell　等（1990）、Marwell等（1979，1980）以及Isaac等（1988a，1988b）等文献，这一系列的实验发现：（1）在单回合博弈中组内成员平均捐赠介于初始禀赋的40%到60%之间，远远超过博弈理论中纳什均衡的预测。个体捐赠水平则有很大的差异，有的捐赠了100%，有的不捐赠。（2）如果重复博弈，平均捐赠水平逐步下降，越来越多的局中人选择搭便车。

刘建华：社会合作与利益协调：国外公共品博弈实验综述Ledyard（1995）对20世纪90年代中期以前的一系列PG博弈实验进行了综述，并识别了一些提高合作水平的因素，包括交流、捐赠的门限值、MPCR的数值；他也讨论了其他因素，这些因素看起来可能起作用但实际上总体效果不佳，比如性别和组的规模。此后，国外的公共品博弈实验基本上是沿着两条线路展开的：一条是探求促使被试自愿合作行为的原因；另一条则关注于如何提高与维持重复公共品博弈中的合作水平，主要包括货币性惩罚和非货币性惩罚及非惩罚机制。鉴于篇幅限制，本文将主要对第二条线路的国外实验研究进行综述。

二、条件合作

国外许多实验研究发现，在公共品博弈实验中存在着不同类型的被试，其中条件合作者（condition　cooperator）是最为普遍的类型（Brandts　et　al，2001；Keser　et　al，2000；Kurzban　et　al，2005；Brandts　et　al，2000，2009），他们对公共品的捐赠水平与他们对组内成员捐赠水平的信念是正相关的。

Fischbacher等（2001）首先对这种条件合作行为进行了直接的实验检验，发现50%的被试是条件合作者。他们的捐赠曲线位于45度线的下方，意味着虽然这些被试的捐赠水平与他们预期组内其他成员的捐赠水平相关，但不是预期他人捐赠多少自己就捐赠多少，而是显现出略微的自私偏向（self-serving　bias）。Fischbacher等认为被试类型的异质性可以合理地解释为什么捐赠水平随时间递减：在实验中每个组包含着条件合作者和搭便车者，对同伴的捐赠水平抱有乐观信念的条件合作者将向公共账户捐赠，但随着时间的推移，他们发现了被试类型的异质性，特别是他们发现组内存在搭便车者，于是他们逐渐减少捐赠，导致捐赠水平的递减。

其他大量研究也探讨这种条件合作行为，这些研究发表时间都比较接近。Sonnemans　等（1999）第一次使用“条件合作”这一术语。他们的实验在3～12个回合内保持组员不变，随后组员逐渐变更，每次有一个被试离开，换另一个被试加入；被试离开的时间是共同知识；一个被试离开之后不会再与其他组员有任何关联，因此在他离开的最后一个回合里没有动机去采用策略，而在其他回合里则有可能采用策略。研究发现，在离开的最后一回合捐赠水平存在明显的下降。他们还发现组内存在着期望他人捐赠的被试自己也捐赠的条件合作行为。

Keser　等（2000）发现被试的行为并不是要么搭便车，要么利他，而是一种固有的条件行合作为。被试使用组平均捐赠的信息来锁定他们自己未来的捐赠，大约80%的参加者采用条件合作行为，在一个回合中高于（低于）平均捐赠的人在下一个回合里会降低（增加）他们的捐赠。

Fischbacher等（2009，2010）拓展了Sonnemans　等（1999）的研究，他们使用两种不同的实验设置分析被试的类型。在P实验里，被试首先进行单个回合的公共品博弈，然后填写问卷，回答他们基于其他组内成员的平均捐赠愿意捐赠多少。在C实验里，被试重新随机配对进行10个回合的线性公共品博弈，在每个回合结束后，要求估计其他组内成员的平均捐赠。在一半的实验局里，被试先进行P实验，紧接着进行C实验（P-C设置），另一半的实验局的实验顺序则相反（C-P设置）。实验发现，55%的参加者是条件合作者，23%的被试是搭便车者。在C和P实验里，条件合作者的信念与捐赠水平显示出稳定的正相关关系。在P实验里，用问卷方式被归类为条件合作者的被试的行为，与接下来他们进行的10回合的C实验中的行为相同。P-C设置和C-P设置中被试的信念的分布无显著差异，表明在被试参加了公共品博弈实验之后诱导出的信念并不影响他们的偏好。

Burlando等（2005）用四种不同的方法来检验被试条件合作的稳定性：（1）采用Sonnemans　等（1999）使用的“策略性方法”，（2）Offerman等（1996）使用的“分解博弈技术”，（3）在重复PG博弈实验中往公共账户捐赠，（4）问卷调查。总体而言，四种方法的结果是一致的，35%的被试是条件合作者，18%的是无条件合作者，32%是搭便车者，剩余的15%不知归为何类。

近年来一些实验考察了地区和文化差异对条件合作的影响。Kocher　等（2008）对美国北卡罗来纳州、奥地利因斯布鲁克和日本东京三个地区的被试进行研究，发现多数人是条件合作者，美国的被试中条件合作者较多，达81%，奥地利和日本则分别为44%和42%。Hermann　等（2008）在俄罗斯四个不同的大学招募了160个被试，研究发现总体上有56%的被试是条件合作者，只有6%是搭便车者，且农村和城市的被试的偏好分布无显著差异，社会经济条件似乎并不影响被试条件合作的偏好。Brandts等（2004）对日本、荷兰、西班牙和美国进行跨文化的研究，也发现了条件合作行为。

鉴于在这些研究中条件合作者处于多数，一个有趣的问题是当条件合作者了解到组内存在其他条件合作者时情况会如何？Chaudhuri　等（2006）发现当向被试提供组内存在条件合作者的信息时，条件合作者的捐赠额度显著增加了。

三、利用货币性惩罚维持合作

第4篇

庇古税是传统的价格控制手段，其税收模型不断完善，主要有庇古(Pigou)税模型及古诺（Cournot）模型和斯坦克尔伯格(Stackelberg)模型等。

一、原始的庇古税模型

为了阐述便利，本文将英国经济学家庇古在1920年出版的《福利经济学》中提出的环境税模型称为原始庇古税模型。按照庇古税原理，由于外部性的存在，私人边际成本曲线与社会边际成本曲线不重合，相差外部边际成本不由经济主体承担，那么最佳私人产出和最佳社会产出存在着差异，从私人决策角度来看，是最优决策(私人边际成本=边际收益)，但从社会角度来看并非是最优的。社会最优产量与私人最优产量间存在着差值，造成资源浪费。在市场经济条件下，经济主体不会自发地减少产量和使用量，进行污染治理，使外部成本内部化，因此，庇古提出政府可以以税收的形式进行 “非常限制”，迫使经济主体实现外部性的内部化，这种对单位污染征收等于污染所造成的边际社会损害的税收即为庇古税。

从理论上说，庇古税可以使资源得到有效配置，使污染减少到帕累托最优水平。在完全竞争的市场中，社会净效益应等于由产生污染的经济活动的总效益减去私人成本，再减去外部成本。庇古得出在完全竞争的市场中，最优的污染税应该等于污染的边际破坏的结论。它能使资源的配置达到帕累托最优，并成为研究解决外部性问题的理论基础。

二、经典庇古税模型

双足寡头竞争模型,可以说是纳什均衡最早的版本，即引入纳什均衡后的经典庇古税模型。在古诺模型里，有两个参与人（两个企业），每个企业的战略是选择产量；支付是利润，它是两个企业产量的函数。每个企业在选择自己的产量最优时，只考虑对本企业产量的影响，而忽视对另一企业的外部负效应。

如果把古诺均衡可以看作纳什均衡的第一个版本，斯坦克尔伯格模型则是博弈精炼纳什均衡的最早版本。在斯坦克尔伯格模型中，企业的行动也是选择产量。不同的是，在斯坦克尔伯格模型中，企业1首先选择产量q1≥0,企业2（一般称为尾随企业）观测到q1,然后选择自己的产量q2≥0。因此这是一个完全信息动态博弈。

古诺模型的分析结论是：企业1有“先动优势”(first-mover advantage),均衡产量1/2(a-c) 相对古诺双足寡头竞争模型时的均衡产量1/3(a-c)有所增加。而企业2拥有信息优势却在竞争中处于劣势，最终的均衡产量q*2 低于企业1的均衡产量q*1，利润也随着产量相应的下降。

三、最优庇古税模型

澳大利亚阿德莱德大学联谊会Damania R. 2000年通过对古诺寡头竞争模型的研究，在原有的经典模型基础上，考虑了开征庇古税对企业带来的负效应，假定环境税收政策的变化会对企业的产量水平产生影响。他的主要结论是：污染税的征收使企业产品的成本上升，导致原已供给不足的垄断产量进一步减少，从而消费者剩余大幅下降。罗云峰等在线性逆需求函数和常数规模报酬条件的假定下，建立了寡头垄断条件下的环境污染税收的完全信息静态博弈古诺模型和完全信息动态博弈斯坦克尔伯格模型。认为提高税收标准会进一步拉大企业产量的差距。从市场的集中程度来看，提高税收标准将使产品的市场份额更加集中在领先企业手中。最优产量随税收标准提高而减少的原因是，税收增大了企业生产的边际成本；提高税收标准将使企业产品的市场价格提高，使该产品的消费者剩余减少。

吴伟、陈明义等人在2003年根据博弈论的基本原理，以古诺双头垄断市场为前提，在古诺模型的假设条件中考虑到了企业的负债水平。讨论在政府和企业的序贯博弈中，政府总体的环境管理政策(特别是污染物的税收水平)对企业资本结构的影响，并分别从企业和政府的角度说明，适度环境管理政策的必要性和重要性。主要结论是，政府总体环境管理政策的松紧，对企业的资本结构将产生较大的影响(负债的比重变化)；负债水平的变化方向与污染税变化的方向相同。在总体环境政策松紧适度情况下，特定的污染税收政策影响企业负债水平的高低。

上述的模型均基于博弈论的纳什均衡原理，其研究主要思路是：首先构造利润函数，然后根据利润最大化的一阶条件，得到各企业的纳什均衡最优产量应该满足的条件。以此，解得最优产量以及最大的利润，而后对于污染税与其它变量的关系分析。求出最优产量以及最大的利润，而后对于污染税与其它变量的关系作以研究。最优污染税的得出，是通过构造社会总福利的函数，一般来说社会总福利包括企业的利润、污染税收收入、污染对环境的破坏等因素，而后总福利函数对污染税t求一阶导数，即为dW(t)/dt，其中W(t)代表社会总财富，t代表税收收入。若使社会总福利最大，则有dW(t)/dt=0。求解这个方程，即可得到最优污染税收以及最优污染税率。这里的目标是社会总福利最大。

从上述基于博弈论思想的几个庇古税模型中可以看出，此类模型均属于微观经济行为的分析，核心在于企业之间的博弈关系。而且较多的文献是对古诺双头垄断市场模型的进化，最终目标是社会总福利最大。从模型参与者的最终博弈结果看，最优的污染税在不同的假设环境下，有不同的结论。但是，由于古诺模型本身的分析是寡头垄断，它的参与者数量太少。当它的参与者数量足够多，或者假设的情况过于复杂，最优污染税的确定会变得格外复杂。

第5篇

关键词:纳税理性;偷逃税;税务筹划

“理性经济人”是经济学的一个基本假设,企业作为市场经营的利益主体,其目标是追求企业经济利益的最大化。因此,企业自然希望能少纳税甚至不纳税,总是想方设法减轻自己的税收负担。在法制不完善的税收环境下,这种动机往往演变为违法的偷逃税行为。随着我国税收法制建设的进一步完善和税收征管水平的提高,偷逃税行为在一定程度上得到了遏制,纳税人开始转向运用科学的税务筹划手段合法减轻自己的税收负担。作为不同的利益主体,企业纳税人追求的是税后利润的最大化,而税务机关则尽可能保证国家税款的应收尽收和及时征缴入库。因此,企业纳税人与税务机关税收征纳的博弈客观存在,只是在不同税收环境下两者之间的策略选择存在一定的差别。

一、企业偷逃税与税务机关的博弈分析

假定企业纳税人欲通过偷逃税手段减轻税负,模型中只考虑税务机关行为对企业偷逃税行为的影响,此时的博弈双方是企业和税务机关。博弈模型的建立:局中人(1)企业,局中人(2)税务机关。博弈双方的策略:企业为偷逃税或不偷逃税也不筹划,税务机关为税务查获或未查获。这里仍作如下假设:偷逃税款额为T,被税务机关查获的概率为P,查获后应补缴税款为T,加收滞纳金并处罚金为C32,查获后用于寻租以减轻处罚的支出为F,因此影响预期收益的因素有T、P、C32、F(为研究上的方便,这里不考虑企业开展偷逃税行为的额外成本支出,如设置两套账成本、心理成本等)。根据假设条件分析得出企业纳税人的得益矩阵,如图1所示[1]:

从可以分析得出,纳税人的预期收益为:

U=T×(1-P)+(-C32)×P

=T(1-P)-C32×P=T(1-P)-λT×P

=T[1-(1+λ)P]

其中税收处罚率λ=C32/T,当T[1-(1+λ)P]>0,即(1+λ)P<1的情况下,纳税人将获取偷逃税收益U>0,此时企业就有了偷逃税的经济激励;但企业并不一定选择偷逃税行为,其具体行为的选择取决于纳税人的依法纳税意识和税法遵从度[1]。

当T[1-(1+λ)P]<0,即(1+λ)P>1的情况下,纳税人偷逃税收益U<0,此时企业偷逃税行为是不经济的,但企业不一定选择不偷逃税。这里需要考虑一个特殊因素——税务寻租,当不存在税务寻租途径时,由于偷逃税的预期收益小于零,企业不会选择完全不经济的偷逃税行为;当存在税务寻租途径,企业的具体行为选择取决于寻租支出F和逃税支出T+C32之间的关系。若F>T+C32,则企业纳税人不会选择偷逃税行为,若F具体来说,在税收处罚率λ既定的情况下,当查获概率P<1/(1+λ)时,企业的理性纳税行为是偷逃税行为;当查获概率P>1/(1+λ)时,企业的理性纳税行为是纳税遵从,但在存在税务寻租的特殊情况下企业的纳税遵从也有可能转化为偷逃税行为。在企业偷逃税行为被查获的概率P既定的情况下,当税收处罚率λ<(1-P)/P时,企业倾向于偷逃税的理性纳税行为;当税收处罚率λ>(1-P)/P时,企业倾向于依法纳税。因此,为有效遏制纳税人的偷逃税行为,税务部门应从两个方面着手:一是加大税收稽查力度,二是加大税收处罚力度,提高违法行为的查获概率和税收处罚率,从而促使纳税人依法纳税。

二、企业税务筹划与税务机关的博弈分析

严格意义上讲,税务筹划是符合国家立法意图的一种合法行为,但这种“合法性”客观上还需要税务行政执法部门的“确认”,而在这一确认过程中客观存在着税务行政执法的偏差,使得企业税务筹划的成功与否存在很大程度的不确定性。对企业和税务机关来说,二者之间的信息不对称主要表现在企业无法准确预测税务机关对企业税务筹划行为的认定态度,税务机关也不可能完全掌握企业所有真实的纳税信息[2]。因此,企业纳税主体与税务机关成为非完全信息博弈下的双方主体。

假定企业所处的环境是一个稳定的经济环境,则企业优先选择开展税务筹划,模型中只考虑税务机关行为对企业税务筹划的影响,此时的博弈双方是企业和税务机关[3]。博弈模型的建立:局中人(1)企业,局中人(2)税务机关。博弈双方的策略:企业为筹划或不筹划,税务机关为税务稽查或不稽查。这里仍作如下假设:企业开展税务筹划的直接成本为C1,机会成本为C2,税务筹划被税务机关认定为违法行为的风险成本即加收滞纳金和税收处罚的金额为C32;企业税务筹划的节税利益为T;税务机关进行税务稽查的稽查成本为C。

当企业选择了开展税务筹划,税务机关具有进行税务稽查或不进行税务稽查这两个选择。当税务机关不进行税务稽查时,企业的收益函数为U=T-C1-C2;当税务机关进行税务稽查时,如果认为企业的税务筹划是合法的,此时企业的收益函数为U=T-C1-C2;如果认为企业的税务筹划是违法的,此时企业的收益函数为U=-C1-C2-C32[4]。

由于受税收征管力量和水平的影响,税务机关客观上并不对每个企业开展税务稽查。假设企业估计税务机关开展税务稽查的概率为P1,不开展税务稽查的概率为1-P1;税务机关开展税务稽查的情况下,对企业税务筹划“合法性”的认定概率为P2,对企业税务筹划“非合法性”的认定概率为1-P2,则企业开展税务筹划的期望收益为:

U=(T-C1-C2)×(1-P1)+(T-C1-C2)×P1×P2+(-C1-C2-C32)×P1×(1-P2),企业不开展税务筹划的期望收益为:U=0。

(一)税务机关的策略选择

尽管税务机关开展税务稽查的目的在于严格税收征管,监督企业依法纳税,现实中并不一定遵循成本收益原则,但为了研究上的方便,这里假定税务机关也是理性经济人,在选择税务稽查时遵循成本收益原则。当企业开展税务筹划时,税务机关开展税务稽查的期望收益为:U=-C×P2+(T+C32-C)×(1-P2);税务机关不开展税务稽查的期望收益为:U=0。当企业不开展税务筹划时,税务机关开展税务稽查的期望收益为:U=-C;不开展税务稽查的期望收益为:U=0。从以上分析可以看出,当企业开展税务筹划时,只有当税务机关的期望收益U=-C×P2+(T+C32-C)×(1-P2)>0,即P2<(T+C32-C)/(T+C32)时,税务机关应选择税务稽查策略;当企业不开展税务筹划时,税务机关应采取不稽查策略。

(二)企业税务筹划的一般策略选择

当税务机关开展税务稽查时,若企业估计税务机关对企业的税务筹划认定为合法时,企业将选择筹划策略以取得税收收益,此时企业税务筹划的期望收益为:U=T-C1-C2,且U>0;若企业估计被认定为违法行为时,企业将选择不筹划策略,此时企业税务筹划的期望收益为:U=-C1-C2-C32<0。即当税务机关开展税务稽查情况下,企业的收益函数:

P2>(C1+C2+C32)/(T+C32),

此时企业应选择开展税务筹划策略;当税务机关不开展税务稽查时,因为T-C1-C2>0,企业应选择税务筹划策略。只有当企业开展税务筹划的期望收益:

P1×(1-P2)<(T-C1-C2)/(T+C32),

此时企业选择税务筹划策略。

结合前面对税务机关与企业税务筹划的策略选择分析,只有当(C1+C2+C32)/(T+C32)

三、企业特殊策略选择的经济博弈分析

这里的特殊策略选择是指企业纳税人在一定的外部环境下,为减轻税收负担所选择的合法筹划或非法筹划,即选择合法的税务筹划行为还是违法的偷逃税行为[5]。假定在相对稳定的税收环境下,企业欲通过一定手段减轻自身税负,模型中只考虑税务机关行为对企业行为选择的影响,此时的博弈双方是企业和税务机关。博弈模型的建立:局中人(1)企业,局中人(2)税务机关。博弈双方的策略:企业为偷逃税或税务筹划,税务机关为税务稽查或不稽查。

这里仍作如下假设:节税额为T,税务机关的稽查概率为P3,并假定企业的偷逃税行为一旦稽查即被查出,而企业的税务筹划行为被认定为合法;偷逃税被查获后应补缴税款为T,加收滞纳金并处罚金为C32,企业开展税务筹划的直接成本为C1,机会成本为C2。因此影响偷逃税行为预期收益的因素有T、P3、C32,影响税务筹划行为预期收益的因素有T、C1、C2(这里不考虑企业开展偷逃税行为的额外成本支出,也不考虑现实中可能存在的税务寻租成本)。为研究上的方便,现引入三个相对率指标反映这些不同的影响因素:一是税收处罚率λ,即λ=C32/T;二是税务筹划节税成本率δ,即δ=(C1+C2)/T,三是税务稽查概率P3。可以分析得出纳税人偷逃税的预期收益为:

U1=T×(1-P3)+(-C32)×P1

=T(1-P3)-C32×P3

纳税人税务筹划的预期收益为:

若U2=(T-C1-C2)×(1-P3)+(T-C1-C2)×P3=(T-C1-C2);

则U1-U2=(C1+C2)-(T+C32)×P3。

当U1=U2,即:

(C1+C2)-(T+C32)×P3=0时,企业采取偷逃税行为与开展税务筹划行为取得的预期收益是一致的。对该式进行调整分析,两边均除以T,则得出δ-(1+λ)P3=0。在λ和P3既定的条件下,当U1-U2>0,即税务筹划节税成本率δ>(1+λ)P3时,企业偷逃税行为的预期收益大于开展税务筹划的预期收益,此时企业的最佳选择是偷逃税行为;当U1-U2<0,即税务筹划节税成本率δ<(1+λ)P3时,企业开展税务筹划的预期收益大于偷逃税行为的预期收益,此时企业的最佳策略选择是开展税务筹划。因此,企业应尽可能降低税务筹划节税成本率,以提高税务筹划行为的经济效益。

在δ和P3既定的条件下,当U1-U2>0,即税收处罚率λ<(δ-P3)/P3时,企业偷逃税行为的预期收益大于开展税务筹划的预期收益,此时企业的最佳选择是偷逃税行为;当U1-U2<0,即税收处罚率λ>(δ-P3)/P3时,企业开展税务筹划的预期收益大于偷逃税行为的预期收益,此时企业的最佳策略选择是开展税务筹划。因此,税务机关应加大税收处罚力度,遏制纳税人的偷逃税行为,促进企业开展合法的税务筹划行为。

在δ和λ既定的条件下,当U1-U2>0,即税务稽查概率P3<δ/(1+λ)时,企业偷逃税行为的预期收益大于开展税务筹划的预期收益,此时企业的最佳选择是偷逃税行为;当U1-U2<0,即税务稽查概率P3>δ/(1+λ)时,企业开展税务筹划的预期收益大于偷逃税行为的预期收益,此时企业的最佳策略选择是开展税务筹划。因此,税务机关应加大税务稽查力度,引导企业减轻税收负担的方式由违法的偷逃税行为转向合法的税务筹划行为。

四、结语

经济激励是影响企业理性纳税行为的根本诱因。偷逃税作为一种违法行为,其可能的预期收益客观上受税务机关查获概率、税收处罚力度等因素的影响。企业税务筹划作为一项合法的理财行为,其预期收益客观上受税务筹划节税成本率、税务机关对税务筹划的合法性认定等因素的影响。因此,为了有效遏制或减少纳税人的偷逃税行为,引导和促进企业开展合法的税务筹划行为,税务机关应加大税务稽查力度,加大对偷逃税等违法行为的税收处罚力度,减少纳税人偷逃税的收益预期,有效降低纳税人偷逃税行为的内在经济激励。同时,加强税务机关人员的职业道德与业务素质教育,从根本上堵住纳税人税务寻租的源头,科学认定纳税人的税务筹划行为,从而切实体现税收执法的严肃性和公正性。对于企业纳税人来说,应在依法纳税的基础上运用科学的税务筹划手段减轻自身税收负担,尽可能减少税务筹划成本支出,降低税务筹划节税成本率,以取得较好的税务筹划效果。在此基础上,纳税人依法开展税务筹划、依法纳税,税务机关依法征税,这样才能真正体现和谐的税收征纳关系,实现“税企双赢”的最佳效果。

参考文献:

[1]张斌.博弈论在税收筹划中的运用[J].商业经济,2004(12):56-58.

[2]张晓美.企业税收筹划研究——基于风险控制、效应的探讨[D].重庆:重庆大学硕士学位论文,2005.

[3]王晓芳,肖琳玲.税收筹划博弈分析[J].合作经济与科技,2007(2):56-57.

第6篇

［关键词］新景区；竞争策略；博弈

［中图分类号］F272 ［文献标识码］A ［文章编号］1005-6432（2012）13-0005-02

1 引言

随着旅游业的发展,旅游资源得到不断的开发,新的旅游景区也层出不穷,截至2012年,全国共有A级景区总数达2569家。由于如此众多的景区存在,造成了景区间竞争关系的进一步复杂,同时对景区间竞争的研究也显得更加重要起来。

关于景区间的竞争策略,很多学者进行了不同方面的研究。在多种研究方法中,博弈论由于本身就是研究利益相关的理性局中人，如何进行策略选择,两者具有很大的相似性,于是博弈论开始被应用于景区的竞争策略研究。

本文主要研究的是在垄断旅游市场背景下,新景区进入市场竞争前面临的选择和策略。本文通过引入旅游经济学需求、供给理论和博弈论知识,分析景区进入前后的市场变化和利润变化,为接下来的博弈分析提供依据,对新景区旅游发展策略进行指导。

2 新景区潜在竞争策略博弈分析

在新景区进入垄断旅游市场面临竞争前,首先要分析已有的市场结构、市场供需情况,并预测新景区的进入带来的市场结构的变化,并进行利润函数的预测分析,在博弈行为中求得最优解,做出相关市场策略的制定。下面首先进行经济学相关条件的设定。

2.1 相关条件的设定

假定参加旅游活动的旅游者都是理性消费者,即会自由选择同样花费下获得最多旅游产品享受(包括获得旅游享受收益的数量和质量)；景区是“理性经济人”管理下的景区,景区行为为理性经济行为。

区域内只有一个景区A,对区域内旅游需求完全垄断,景区B试图进入区域旅游市场,但景区B与景区A之间所开发的旅游产品替代性难以判断,为了便于比较分析,本文研究中设定了两种极端可能。即：两个景区旅游产品属于同类型产品,具有完全替代性,景区B的进入导致对游客对景区A的需求减少；两个景区旅游产品属于互补型产品,即完全没有替代性,产品互补,景区B的进入对景区A旅游需求的影响很小(研究中假定可以忽略)。

2.2 利润分析及博弈策略分析

(1)两景区旅游产品属于同类型产品。两景区生产同类型产品,且属于同一区域,所以假定景区B的边际成本等于景区A的边际成本,都为c,两个景区的价格也同为p,产出分别为qA和qB。对于景区B进入市场竞争后的决策行为景区A可以进行预测。

由此我们可以得出：后进入旅游市场的景区B,生产规模为景区A的1/2时,景区利润最大。

在现实旅游市场竞争中,作为市场领先者的景区,在竞争博弈中拥有先动优势,既可以通过保护自身旅游知识产权,来增加旅游市场进入壁垒,打击追随者的模仿；也可以实行品牌战略,推广景区的知名度,建立旅游者对景区形象的良好认可,从而影响旅游者的选择,争取更多的潜在旅游市场。而作为追随者(或者叫模仿者)的新景区在建立之初,也有一些后动优势,追随者存在旅游产品开发的“搭便车”行为,可以大大减少先期投资；追随者进入旅游市场后,可以开发差异化的旅游产品,从而增强竞争力,摆脱追随者的阴影,成为旅游地新的寡头景区。

西递、宏村是皖南古村落的代表,在2000年被联合国教科文组织列入世界文化遗产名录，成为皖南古村落旅游的先行者。此后,一批具有同样徽风特色的古村落开始不断开发,南平、关麓等作为旅游市场的追随者开始进入,这些村落的旅游资源特色基本一致,内部差异性较小,所以旅游市场规模难以扩大。而同为古村的塔川,推出了差异性的旅游产品,在粉墙黛瓦的徽派建筑之上,强调自然生态的完美结合,成为独具魅力的山间村落,并被摄影家们推崇为中国三大秋色观赏景区之一,从而赢得了相当数量的旅游爱好者,摆脱了古村旅游追随者的阴影,树立了自己的旅游形象。

(2)两景区旅游产品属于互补型产品。两景区生产互补型产品,产品互补替代,则景区B的进入并不影响景区A的供给函数,景区A和景区B成为不同旅游客源市场的垄断景区,但假定景区扩大规模和宣传力度后,必定赢得更多旅游者的青睐,增加旅游收入,但不减少其他旅游景区的游客数量和收入。此时,旅游知名度的竞争成为主要竞争,因为景区成了该地区知名景区后,旅游市场规模更大,获得政策性的旅游宣传更多,从而获得更大的知名度和更多的利润,景区发展潜力大。

此时对于景区B的进入,景区A可采取两种不同的策略：扩大景区规模和宣传,提高旅游服务质量,巩固该地区知名景区的地位或不扩大景区规模,放任景区B的进入。景区B也会再相应做出新的决策,下图详细表示了两景区的博弈策略。

景区博弈分析树

收益组合(b,a)表示：景区A放任景区B的进入,景区B获得一定的旅游市场,并得到收益为b,景区A未受景区B进入影响,依然拥有a的收益,还将是该区域的知名景区。此时,如果景区B采取扩大景区规模的策略,则会得到更多的收益b1,并将逐步超越景区A的知名度,成为该区域的知名景区。

而如果景区A在景区B进入旅游市场后,采取了扩大规模的策略,则可以巩固景区A的知名景区地位,并获得更多的收益a1。景区B在景区A扩大规模后,长远发展将会遭遇瓶颈,最优的选择是进行二期开发,进一步扩大规模,与景区A实现综合实力的竞争,但如果景区B在进入旅游市场后,未能在新的旅游产品推广中得到较为客观的收益,即景区B的旅游产品未能得到旅游者的特别青睐,此时的景区B则不宜立刻扩大景区规模,而应从旅游产品的设计中总结得失,并进行更为细致的市场分析。

该博弈分析过程,与现实中主题公园与传统旅游景区之间的竞合博弈相类似。传统景区拥有一定的知名度和影响力,而主题公园作为资源类型不同的景区,存在较大的潜在客源市场。成功的主题公园往往富有活力,存在不断的创新精神,在传统景区缺乏变化时,主题公园就可趁机投入生产,扩大宣传,从而争取更多客源市场,并取代传统景区,成为区域内新的知名景区和名牌景区。

常州市中华恐龙园这一主题公园的建立,便使传统景区常州红梅公园的景区地位降低。自2000年常州中华恐龙园开馆以来,就得到政府的支持,其主馆建筑是中国国土资源部、中国地质博物馆与常州市人民政府的合作共建项目。常州中华恐龙园的游客量自开馆以来逐年上升,2008年游客量已超过200万人次,特别在2006年红梅公园免费开放后,中华恐龙园更是成为常州市旅游宣传的名牌,并成为带动常州旅游业发展的龙头。而现在中华恐龙园二期工程已经结束,景区规模不断扩大,更加成为常州旅游的支柱。

3 结论

本文通过对新景区旅游竞争策略的博弈分析,得出以下结论：生产同类型旅游产品的两景区间的竞争,作为追随者的新景区,应利用后动优势,合理选择生产规模,并主动利用差异性旅游产品的开发,来摆脱追随者的阴影,超越领先景区；生产互补型旅游产品的两景区间的竞争,更多关注的是知名度的竞争,只有不断地进行创新的扩大化生产,不断提高旅游服务质量,才能打败竞争对手,成为区域内的核心景区,成为区域旅游宣传的名牌。

第7篇

1944 年冯・诺伊曼（Neumann）和奥・摩根斯坦（Morgenstern）合作出版了《博弈论与经济行为》一书，标志着博弈理论的正式提出。博弈论又称对策论（GameTheory），是在研究各方策略相互影响的条件下，理性决策人的决策行为的一种理论，是分析博弈行为和博弈决策的一门科学。

一场博弈主要由以下五个因素构成：一是博弈的参与者，又叫博弈方或局中人，是指博弈中能独立决策，选择最大化效用并承担结果的参加者。二是博弈的策略，在博弈中由参与者做出的策略选择，直接、实用地针对某一个具体问题采取的应对方法。三是收益，是参加者选择策略并加以实施后的结果，是参与人从博弈中获得的效用水平高低的体现。四是博弈的次序，博弈双方在策略选择和行动中的顺序。在博弈中，即使同样的博弈方、同样的策略，博弈顺序的不同也会对博弈的结果产生重要的影响。五是博弈的均衡，指所有参与者的最优战略组合。一般而言，一个博弈至少应该具备前三个要素。

博弈论起发于数学领域，盛行于经济领域，在20世纪50年代得到较大发展，和其他学科之间的关系也逐渐深入。20世纪90年代以来博弈论领域的经济学家已经三次获得经济学诺贝尔奖，该理论已经对经济学产生了重大的影响。随着博弈论研究的日益深入和理论框架的不断完善，经济学家和管理者们逐渐把这一理论引入到经济、政治、外交、军事、教育等领域中。在高校辅导员激励管理过程中，如何借鉴和运用博弈论的管理理念与方法，提高高校辅导员激励管理的效度，是本文探讨的主要内容。

一、高校辅导员激励管理引入博弈论的必要性

（一）博弈论可以满足高校辅导员队伍管理方式创新的迫切需求

辅导员是开展大学生思想政治教育的骨干力量，是大学生日常思想政治教育和管理工作的组织者、实施者和指导者。辅导员队伍的整体素质，对思想政治教育的效果和学生素质有着重要影响。随着社会经济的发展，以及我国高校发展和改革的不断推进，高校辅导员的作用也愈加重要。而近些年来辅导员队伍中面临的一些问题，如工作任务重、薪酬待遇较差、人员积极性不高、职业发展困扰较多等都极大地影响着这支队伍的稳定性，给高校辅导员队伍管理和思想政治教育工作带来严重的挑战。而能根据环境变换而做出应对策略的博弈管理可以满足高校寻求辅导员队伍管理的新方式的迫切需求。

（二）博弈论可以丰富高校辅导员激励管理理念

随着辅导员在高校人才培养中发挥的作用日益重要，全社会对辅导员的重视程度正不断提高，党和国家注重从各个层面对辅导员进行激励，以期充分调动他们的工作积极性和保证这支队伍的稳定性。国内外专家学者从心理学、管理学等多个视角开展了对高校辅导员激励机制的研究。从目前我国高校辅导员激励管理研究的现状来看，国内外研究者主要从工作制度、措施、环境以及辅导员需要等因素研究辅导员激励，把激发辅导员工作的积极性和创造力，挖掘其工作潜能，作为辅导员激励问题研究的主要出发点。这些激励机制的形成与应用一定程度上缓解了高校辅导员激励管理中的问题。但是随着环境和辅导员需求的不断变化，高校辅导员激励管理需要更多更丰富的先进理论来作为指导。博弈论作为近些年来在诸多领域被广泛应用，越来越受到大家重视的科学理论，可以极大的丰富高校辅导员激励管理理念。

（三）博弈论与高校辅导员激励管理存在契合

在目标上，博弈论的假定前提是“理性的经济人”，博弈的参与者都要追求各自利益的最大化。而在高校辅导员激励管理中，学校和辅导员作为博弈的双方，为了自身利益的最大化，不可避免的会产生重复博弈。而辅导员与辅导员之间，因为职务晋升、工作分配等问题的存在，也势必会产生智猪博弈。但若满足或构建一定的条件，学校与辅导员，辅导员与辅导员之间的合作共赢依然是有可能的。而这点则与博弈论有着契合之处。

综上所述，把博弈论引入到高校辅导员激励管理中，不仅是新形势下满足高校辅导员激励管理寻求创新方式的迫切需求，而且为解决高校辅导员激励机制问题提供了一种新的思维方式和理念，这为消除传统高校辅导员激励机制中存在的弊端和解决其内在矛盾提供了有效途径，是提高高校辅导员激励管理效度的必然选择。

二、高校辅导员激励管理中的博弈关系分析

辅导员在高校这样一个特定的环境中，较容易因为学校管理者恰当的激励措施而产生积极的行为动机，进而影响他们的工作表现与积极性。高校在实际管理中，可以遵循博弈规则来研究激励管理，使得所采取的激励措施符合管理实践的需要。

1.学校与辅导员

站在博弈论的观点考虑，高校作为博弈的一方，希望能够以最少的劳动力成本（最低的工资）获得最大的产出（辅导员受到激励后所采取的积极行动带来的工作成效），这是其利益最大化的选择；而博弈的另一方―――辅导员，希望以最少的付出（付出最少的时间和精力）换取最大的回报（高额的工资、成绩的取得、精神的满足感与成就感），这是其利益最大化的选择。所以，投入与回报是这一博弈中的两个关键所在。处于长期重复博弈中的两个对策者―――高校与辅导员，想要获得个人利益及整体利益的最大化，选择适当的合作策略是必要的。而这种合作的关系，正是博弈论的一种―――重复博弈。

2.辅导员与辅导员

在高校中，除了学校与辅导员的重复博弈外，基于辅导员彼此之间的角色定位不同，做事能力、人际关系等因素的不同，辅导员与辅导员之间，也客观存在着博弈关系。如，不同职位的辅导员之间，就存在着不平等的博弈―――在同一团队中的辅导员由于工作态度与能力不同而出现的“搭便车”式（智猪博弈）的不均衡的博弈关系―――这种强势与弱势的不平衡，往往造成辅导员队伍中的弱势方（小猪）采取坐享其成的等待型的最佳策略，而强势方（大猪）的辅导员则往往疲于做事，这样最终不利于辅导员的均衡发展；另外，不是同一团队的辅导员之间也有可能存在着不均衡的关系―――人际关系好的辅导员往往可以得到领导和同事更多的庇护及赏识，而人际关系不好的辅导员往往会因此采取消极的应对策略，更加消极的对待工作。

三、博弈论视角下高校辅导员激励管理的有效路径

通过以上对学校与辅导员、辅导员与辅导员之间的博弈关系分析得知，对高校辅导员的激励对策和措施不能依赖传统的激励机制，而需要从多方面考虑切合这一群体特点的因素，，在满足个体需求时充分调动其工作的积极性，同时需耍调动其他方面的各耍素形成合力，构建并完善辅导员激励机制，提高其工作的有效性。

（一）以物质激励为基础，建立透明、合理的薪酬制度，

物质是人类生存和发展的基本需求，是马斯洛需求层次理论的基础。随着当前社会经济的发展和居民收入水平的增加，辅导员的低收入与其工作的高付出不成正比，这成为影响高校辅导员队伍稳定性的重要原因。根据博弈论原理改革高校薪酬制度，建立合理的薪酬级别，充分体现出薪酬制度的保障功能与激励功能。

一方面高校应提高辅导员的整体工资水平，满足他们追求“合理利益的最大化”，使他们能安心于本职工作。同时，高校还应突出薪酬制度的透明与合理性，这样有利于辅导员明确行为与后果，努力与回报之间的关系，有利于维持竞争的公平性和透明性，促进辅导员之间积极竞争关系的发展。

（二）以精神激励为突破口，满足辅导员的情感需求

情感作为一种巨大的精神力量，能够直接影响人的行为方式。高校在进行物质激励的同时，也要发挥精神奖励的重要性，给予辅导员更多的人文关怀。随着当前学生工作环境的复杂多变，学生特点的多样化，社会对辅导员要求的提高，导致辅导员面临的工作量和工作压力持续加大，工作积极性下降。高校管理者应充分认识辅导员在高校思想政治教育工作中的重要性，积极加强与辅导员的情感交流，工作中尊重他们的劳动成果，生活中帮助他们解决实际困难，积极建立一种彼此信任、团结和谐的工作氛围，使辅导员能够更加舒心的开展工作。

（三）以公平、合作、共赢为目标，完善与改进辅导员考核办法

对辅导员工作考核的准确与公正，也是影响辅导员激励的重要因素。因此，对辅导员工作的考核一定要多渠道、全方位进行评定和测量，同时要坚持定性与定量相结合的原则。高校应引入公平的竞争机制，坚持“公平公正、论功行赏”的竞争原则，对于考核优秀的辅导员给予奖励，通过颁发荣誉证书、发放一定数额的奖金、给予进修机会等特别奖励，使其感到一种精神上的满足，从而更加努力地工作。对于考核较差的辅导员给予适当的惩罚，激发他们工作的责任感。这样既可以维持学校与辅导员之间的合作关系（双方共赢），又保持了辅导员之间竞争的公平性（多劳多得）。

（四）以辅导员职业生涯规划为导向，完善培养机制

近些年来由辅导员在工作中成就感普遍偏低，职业受挫感较易产生，自认为职业前景黯淡等原因所带来的职业倦怠成为影响辅导员队伍稳定性的另一重要因素。鉴于此，高校应按照《教育部关于加强高等学校辅导员、班主任队伍建设的意见》中明确提出“要统筹规划专职辅导员的发展。鼓励和支持一批骨干攻读相关学位和业务进修，长期从事辅导员工作、向职业化、专家化方向发展”的要求，帮助辅导员落实自身职业生涯发展规划，确立职业发展目标。一方面完善辅导员的培训机制，巩固和完善现有的多形式、多层次的辅导员培训体系，不断提高他们的思想政治素质与管理能力，提升辅导员的职业认同感；另一方面要积极探索辅导员的流动机制，拓宽辅导员的发展道路，支持有能力的辅导员转任道行政、教师和科研等岗位。

经济博弈理论范文

第1篇

第2篇

第3篇

第4篇

第5篇

第6篇

第7篇

港澳经济

商展经济

经济导刊