契约精神与坑生不坑熟 金超 大部分受过大学教育的人都了解契约精神的好处。一般来说,把时间用于监视和督促他人履行承诺劳心费力,而把这些时间用于工作、学习或休闲,能得到或短期或长期的好处。大家也都知道,单方面的守信至少在经济上不合算。考虑下面的单期博弈 不难发现,(守信,守信)和(不守信,不守信)都是纯策略纳什均衡。 如果一个序贯博弈的每一阶段都是如上的博弈,那么可以定义一个“冷酷策略”和相应的“临界耐心水平”,使得大家一直守信——处于一个更好的均衡上。 下面我想利用这个博弈说明“坑生不坑熟”的风气是如何形成的。简单起见,假定任何个体都与熟人进行序贯博弈,而与生人进行单次博弈。社会总人口足够多,以至于一个人的熟人圈子规模与社会总人口相比无限趋近于零。下面假定社会中存如下在三种人: 谁都坑(黑色人),比例为 a 谁都不坑(白色人),比例为 b 坑生不坑熟(灰色人),比例为 1-a-b 进一步做如下假设: 每个人一生与熟人进行 x 次博弈,与生人进行 y 次博弈 生人、熟人中三类人的比例与社会比例相同 每个人对熟人有完全信息,对生人完全没有信息 折现率为 1 假设现在出现了一个聪明一些的人,他会根据熟人的类型选择自己的策略,而面对生人时,他总选择同一个纯策略——坑或不坑。那么他面对熟人时的选择是: 面对黑色熟人,坑对方,得到支付 3ax 面对灰色或白色熟人,不坑对方,得到支付 10x(1-a) 面对生人时,他的支付为 总是选择坑对方,支付为 3(a+b)y+8y(1-a-b)=8y-5(a+b)y 总是选择不坑对方,支付为 -(a+b)y+10y(1-a-b)=10y-11(a+b)y 这个聪明些的人选择“永远坑生人”的条件是 2y-6(a+b)y<0,即 a+b>1/3 假如 a+b>1/3,且这个人更聪明一些,他可以选择与哪些人成为熟人。容易发现,他会选择与灰色人、白色人成为熟人。这样他一生的总支付就变成了 10x+8y-5(a+b)y。 同时,这个人成为了一个灰色人,当然他是一个“聪明的灰色人”。他与普通灰色人的区别在于,他不会与黑色人成为熟人。 下面我要做一个可能不太合适的假设:“聪明的灰色人”只能由灰色人转变而来。这个假设的好处是,对于黑色人来说,熟人的结构改变了,但对于白色人来说,熟人的结构没有改变。 假设有比例为 s 的灰色人变成了“聪明的灰色人”,那么对于黑色人,熟人结构变成了: 黑色:a/(a+(1-s)b+1-a-b)=a/(1-sb) 灰色:(1-s)b/(a+(1-s)b+1-a-b)=(b-sb)/(1-sb) 白色:(1-a-b)/(a+(1-s)b+1-a-b)=(1-a-b)/(1-sb) 那么黑色人在熟人身上取得的支付为: 黑色:3ax/(1-sb) 灰色:8(b-sb)/(1-sb) 白色:8(1-a-b)/(1-sb) 黑色人在熟人身上取得的总支付为:(3ax+8x(1-a-sb))/1-sb=8x-5ax/(1-sb) 而黑色人在生人身上取得的总支付不变:3ay+8y(1-a)=8y-5ay。所以这时,聪明的灰色人越多,黑色人在熟人身上取得的总支付越少。如果所有灰色人都转换为聪明的灰色人,那么黑色人在熟人身上取得的总支付为:(3ax+8x(1-a-b))/1-b=8x-5ax/(1-b) 这样一来,黑色人一生取得的总支付为:8(x+y)-5a(y+x/(1-b)) 假设所有的灰色人都变聪明后,黑色人也开始变聪明:他们可以在 x+y 固定的前提下,选择 x 和 y 的值。这样一来,我们知道,黑色人的最优选择是 x=0。促成这一选择的原因是来自“聪明的灰色人”的惩罚——把黑色人踢出自己的熟人圈子。惩罚系数为 1/(1-b)。 现在假设有 w 比例的黑色人变聪明了,那么不聪明的黑色人在熟人身上的收益分别为: 黑色:3(1-w)ax/(1-b-wa) 白色:8(1-b-a)x/(1-b-wa) 那么不聪明的黑色人在熟人身上的总收益为:3(1-w)ax/(1-b-wa)+8(1-b-a)x/(1-b-wa)=8x-5(1-w)ax/(1-b-wa) 所以,不聪明的黑色人从社会中取得的总支付为:8x-5(1-w)ax/(1-b-wa)+8y-5ay=8(x+y)-5a((1-w)x/(1-b-wa)+y)=8(x+y)-5a[(1-w)x+(1-b-wa)y]/(1-b-wa) 这时,若(1-w)x/(1-b-wa)>y,那么对于聪明的黑色人来说,维持 x=0 的选择是正确的。反之,则聪明的黑色人会改变选择。下面我们来看看(1-w)x/(1-b-wa)与 w 之间的关系:它对 w 的一阶偏导数为:[(-x)(1-b-wa)-(-a)(1-w)x]/(1-b-wa)^2=(a+b-1)x/(1-b-wa)^2=<0 这个结果非常不好。因为(1-w)x/(1-b-wa)是单调的,所以即使我们能求出一个临界值 w,它所代表的均衡也是不稳定的。这是因为如果与熟人博弈时,黑色人比例越低,黑色人的总收益也越高,在其次均收益超过了坑生人时,聪明的黑色人会选择多与熟人博弈,但这又会反过来拉低熟人博弈的收益,如是往复。 假如我们对白色人也施加同样的假设:白色人也可以在 x+y 给定的前提下选择 x 和 y 的值,那么白色人与熟人博弈的收益为: 黑色:-ax 白色:10(1-a-b)x 灰色:10bx 总收益为 10x-11ax 其与生人博弈的收益分别为 黑色:-ay 白色:10(1-a-b)y 灰色:-by 总收益为 10y-11(a+b)y 易知这时最优的 y=0,而且白色人有激励去“变聪明”。 而这时无论黑色人是否聪明,其遇到的生人都只会干一件事:坑你。这时无论是聪明还是不聪明的黑色人都会只跟熟人博弈。而由于所有的灰色人都变聪明了,黑色人的熟人中也不会出现灰色人,只会有黑色人和白色人。这时黑色人与熟人博弈的收益为 黑色:3a(x+y)/(1-b) 白色:8(1-b-a)(x+y)/(1-b) 黑色人从社会获得的总收益为:8(x+y)-5a(x+y)/(1-b)=10 而白色人与熟人博弈的收益为: 黑色:-a(x+y)/(1-b) 白色:10(1-b-a)(x+y)/(1-b) 白色人从社会获得的总收益为:10(x+y)-11a(x+y)(1-b) 这个变化发生后,灰色人的收益也改变了。因为他们在社会上只会遇到灰色人。但是我们暂时还没有假设他们能改变 x 和 y,所以他们目前的收益是: 与熟人:10x 与生人:3y 总收益为 10x+3y=10(x+y)-7x 现在我们终于可以做一些好玩的事情了:在三类人的支付上都消去 10(x+y)后乘以 -1,我们得到三类人的“颜色惩罚”: 黑色人:(x+y)[2+5a/(1-b)] 白色人:(x+y)[11a/(1-b)] 灰色人:7x 容易知道,谁的“颜色惩罚”比较大,谁在社会中就混得越惨。 先比较黑色人和白色人:若 2>6a/(1-b),那么黑色人比较惨,反之则白色人惨。意思就是黑色人越少,黑色人越惨;灰色人越少,黑色人越惨。 然后比较黑色人和灰色人。用黑色人的惩罚除以灰色人的惩罚,得到: [2/7+5a/7(1-b)](1+y/x) 好玩的事情发生了:生人越多,黑色人越惨;黑色人越多,黑色人越惨;灰色人越多,黑色人还是越惨。 最后比较灰色人和白色人,白色人的惩罚除以灰色人的惩罚,得到: [11a/7(1-b)](1+y/x) 白色人的境况和黑色人完全一样。这意味着 人口流动性越大的地方,灰色人的优势越明显 坏人(黑 + 灰)越多的地方,越需要合作,即使是和坏人合作 如果坏人特别多,他们之间的内耗会使得好人反而取得生存优势,尽管好人会被坑,但他们遇到好人后的正收益足够弥补 这些结论可以用来为下面的事实提供直觉: 火车站、长途汽车站骗子多 黑手党成员的义气与忠诚 再乌烟瘴气的地方也有好人 但是上面的分析没有直接给出把欺诈社会转化为诚信社会的方法。不过容易想到一个直观的方法:降低不守信的支付。那么如何降低呢?在人口足够多时,依靠严刑峻法。在人口少,或者干脆是一个小圈子时,也可以由“信誉”来替代立法执法。用“信誉”代替立法执法的一个例子是金融行业。各国的金融行业都经历过野蛮生长期。随着个人和机构信誉的逐渐建立,违约率高的个人和机构业务越来越少,这些机构的运营成本也越来越高。 但这并不意味着靠市场自发纠正违约行为就是最优作法。调整和建立信誉需要时间,各色人等“学聪明”也非一日之功。以“违约行为会被自发纠正”为由,无视自发纠正过程越长,社会中累积的福利损失就越多这一事实的论述,采信的价值不高。 ——————————————— 发自知乎专栏「经济学与金融学杂货铺」