博弈论|支付(收益)的表示形式
博弈论作为一门研究决策者策略选择和结果预测的学科,支付(收益)是其中一个核心概念。支付的表示形式在博弈论中起着至关重要的作用,它用于描述参与者在不同策略下可能获得的利益或损失。本文将详细介绍博弈论中支付的表示形式,探究其起源和应用,并通过具体例子解释其在博弈分析中的实用性和重要性。
支付表示形式的起源
博弈论的起源可以追溯到20世纪初,经济学家冯·诺伊曼和摩根斯坦在他们的著作《博弈论与经济行为》中首次提出了博弈论的基本概念。支付作为博弈中的重要要素,用于衡量参与者在不同策略下的利益变化。最初,支付的表示形式主要采用数值形式,表示在不同策略组合下的支付(收益)数额。
对于名词"支付"与"收益",可以认为支付等同于收益(对应的单词都是"payoff")。
数值形式的支付表示
数值形式是博弈论中最常见的支付表示形式之一。它通过给每个策略组合分配一个具体的数字来表示参与者的支付或收益。数字可以是正数、负数或零,分别代表正收益、负收益或无收益。具体的数字大小可以代表工资、利息、获胜次数、消耗时间等等,能够用数字度量的具有实际意义的事物(实体物或虚拟物)。例如,在囚徒困境博弈中,甲和乙选择不同的策略,他们可以通过一个收益矩阵来表示每个策略组合下的坐牢年限。通过比较支付数字,参与者可以选择最优策略以获得最高的收益。
细心的读者可能会发现,在不同的书籍或文章,乃至同一个作者(比如笔者)的不同文章中,用于表示各个囚徒坐牢年限的数字可能都不相同。但是,囚徒困境最终的结果却都一样,这说明了一件事情:在博弈论中用于表示支付的数字仅是一个数而已,表示参与人某个策略优于参与人的其他可选策略。所以,无论用什么数字表示,都不会影响最终的结果。
对于上图囚徒困境的两个收益矩阵,可这样解释。
囚犯在A城市被抓,警察提供的选择:
1.若一人坦白,而对方保持抗拒,此人获释,抗拒者将坐牢10年
2.若二人都保持抗拒,则二人同样坐牢1年
3.若二人都互相坦白,则二人同样坐牢8年
囚犯在B城市被抓,警察提供的选择:
1.若一人坦白,而对方保持抗拒,此人获释,抗拒者将坐牢8年
2.若二人都保持抗拒,则二人同样坐牢0.5年
3.若二人都互相坦白,则二人同样坐牢5年
就如同,不同城市的法院对于相同案件判刑年限可能不同一样,所以囚徒困境的收益矩阵中囚犯的收益在不同的地方可能不同。
数值形式的支付优点:
1.容易计算出当前博弈的总收益
2.数字本身也是一种信息,参与人在获得更多的信息时,有助于做出理性的决策
3.方便进行数学、科学分析以及计算机处理
数值形式的支付缺点:
1.具体的数字多大不太容易确定
2.需要对策略空间内每种策略分配数字,策略非常多时表示支付的数字容易出错
序数形式的支付表示
除了数值形式,序数形式也是支付表示的一种常见形式。所谓序数,即表示顺序的单位。可以是:"第一","第二","第三"等,或者是:"最优","中等","最差"等之类的形式。与数值形式的支付表示一样,来说明参与人的某种策略优于参与人的其他策略。
对于囚犯来说,无论在任何地方被抓,面对警察给出的选项,对囚犯来说坦白总是优于抗拒。所以,囚徒困境收益矩阵的序数形式的支付表示如上图所示。
序数形式的支付优点:
1.不用为每种策略分配具体的数字
2.只需把策略空间所有策略依次排序即可
序数形式的支付缺点:
1.无法表示支付的特殊含义(如工资金额。只表示优于其他策略,优多少不知道)
2.无法表示总体收益情况
支付的特点
从上文可知,支付主要用于描述参与者在不同策略下可以获得的利益或损失,作为理性的博弈参与人不会选择坏的策略,如何选择的依据就是所选择策略能够带来的直接收益。
支付无论是使用最原始的数值表示形式,还是序数表示形式。除了能够说明策略所带来的收益,最重要的是可以指点参与人通过支付信息应该如何做出选择,从而使收益最大化。所以,支付使用哪种表示形式就显得无关紧要,一般只要能够表示当前某个策略优于其他可选策略即可。
应用与实例解析
支付表示形式在博弈论中有着广泛的应用。它不仅可以帮助分析博弈过程中的决策和策略选择,还可以用于预测博弈结果和制定最优策略。例如,在拍卖市场中,卖家和买家面临着竞争和决策的博弈。通过使用支付表示形式,可以对不同出价和竞争策略下的支付进行分析和比较,从而帮助参与者制定最佳出价策略以获取最大利益。
此外,支付表示形式还被广泛运用于博弈模型的解决和分析中。通过建立数学模型和使用支付表示形式,研究者可以通过计算和优化方法来确定最优策略和结果。这种方法可以应用于各种实际场景,如企业间的价格竞争、政府间的谈判和冲突解决等。
结语
支付(收益)作为博弈论中的重要概念,其表示形式在博弈分析中起着关键作用。数值形式和序数形式是最常见的支付表示形式,它们通过数值和序数的方式描述参与者在不同策略下的支付变化。支付表示形式的应用广泛,不仅可以帮助参与者进行最优策略选择,还可以用于预测博弈结果和解决实际问题。通过深入理解支付表示形式的起源和应用,我们可以更好地理解博弈论的基本原理,并将其应用于实际决策和策略制定中,以实现最大化的利益和效益。