决策论与因果模型

2021-11-01 作者:吴东颖 来源:《中国社会科学评价》2021年第3期

摘  要:面对不确定未来状态与行动结果的决策问题,决策论推荐行动者选择极大化期望效用的行动选项。

关键词:因果决策论;因果贝叶斯网络;因果模型;决策论;因果性

  

  摘要:决策论探讨行动者在面临决策问题时应如何理性选择与行动。面对不确定未来状态与行动结果的决策问题,决策论推荐行动者选择极大化期望效用的行动选项。行动者必须预测各行动选项会因果地导致何种结果,所以因果判断是决策论中的重要问题。在因果结构复杂的决策问题中,行为将因果地导致何种结果往往不易判断。因果模型是判断与发现因果关系的新兴研究。由于因果模型能协助行动者更精准地预测行动所产生的结果,所以,因果模型为决策论提供了新的工具箱。此外也要对因果模型在决策论的运用做出反思,为可能产生的局限性提供不同的解决策略。

  关键词:因果决策论 因果贝叶斯网络 因果模型 决策论 因果性

  作者吴东颖,中国科学院哲学研究所讲师(北京100049)。

 

  决策论(Decision Theory)探讨行动者事实上如何选择行动与应该如何选择行动。不论是日常生活中的选择,例如出门是否带雨伞、早上起床是否刷牙等,或是生命中的重大决策,例如是否与此人结婚、是否从事某个职业等,这些决策问题都是决策论所关注的对象。决策论可区分为规范性的决策论与描述性的决策论。描述性的决策论试图解释与预测当行动者面对决策时,如何在事实上做出选择以及如何做出行动的问题。描述性的决策论是心理学、认知科学与经济学研究所关注的重点之一。规范性的决策论关注当行动者在面临决策问题时,对行动者应该如何做出理性选择(rational choices)给出建议。规范性的决策论一直是哲学研究所关注的焦点,也是本文所关注的对象。其涉及的哲学问题包括:理性的选择应遵从何种原则?这些原则是彼此冲突或相容?决策问题应如何表征?如果将决策问题表征为可能的行动选项(options)与世界的可能状态(states of the world),行动选项与可能状态的表征有什么限制?行动者的主观概率(subjective probabilities)、偏好(preferences)或效用(utilities)应如何表征?如果经验科学发现人类在某些决策问题中总是违反决策理论,应修正决策理论或是承认人类决策的缺陷?决策论中最热门的哲学问题是,行动者是否应考虑因果信息或是证据信息?这些哲学问题都亟待哲学家解决。在哲学界,决策论一直是热门的话题。例如,《哲学家年鉴(The Philosopher’s Annual)》选出的2019年英语世界最佳十篇哲学文章中,其中至少有一篇的主题是决策论的哲学问题。

  因果模型是判断与发现因果关系的新兴研究。简言之,利用数学工具寻找不同事件或变量之间的变化,建立正确的因果观念,而不同于过去仅盲目寻找各变量的统计相关性。在决策论中,行动者必须判断行动可能会因果的产生何种结果,由于因果模型能协助行动者更精准地预测行动所因果产生的结果,因果模型在决策论中应如何应用与实践,是最近决策论哲学家所关注的话题。

  一、决策论问题

  假设行动者不确定明天是否下雨,他可以选择花钱买雨伞,或是不花钱买雨伞。他相信明天下雨的概率是60%,不下雨的概率是40%。他不想买雨伞,但更不想被淋湿。决策论以单位效用表征行动者对各可能结果(outcomes)的效用。例如,行动者相信不买雨伞且不下雨的价值是4单位效用,不买雨伞且下雨的价值是0单位效用。买雨伞将损失2单位效用,但不会受到下雨影响,所以买雨伞且下雨,与买雨伞且不下雨,两个可能结果的价值相同,都是2单位效用。在这个决策问题中,因为未来的可能状态不确定,所以可以计算各行动选项的期望功效。买雨伞的期望效用是40%×2+60%×2=2。不买雨伞的期望效用是40%×4+60%×0=1.6。因为买雨伞的期望效用大于不买雨伞的期望效用,所以理性的选择是买雨伞。

  买雨伞的决策问题简单例示了决策论对决策问题的经典应用方式。在介绍因果模型在决策论中的应用与发展前,本文仅关注规范性决策论与风险型决策(decision under risk)。行动者能对未来的各种可能状态指定概率,这种能对未来各可能状态指定概率的决策,为风险型决策。另外,在本文中规范性决策论关注的是工具理性,而不是道德理性。

  买雨伞的例子是典型的风险型决策问题。在这个例子中,决策论学家普遍诉诸极大化期望效用原则(the principle of maximizing expected utility),认为只有期望效用最大的选项才是符合理性的选择。极大化期望效用原则以每个可能结果的效用和这个结果发生的概率加权计算。一般而言,诉诸极大化期望效用原则的论证有二:第一,假如行动者是重复地做同样选择,那么期望效用代表行动者长期而言平均获得的效用;第二,极大化期望效用原则可从一些决策论的基础公理中推导而出。由于篇幅有限,不再赘述。但必须指出极大化期望效用原则有不少反例。例如阿莱悖论(The Allais Paradox)、埃尔斯伯格悖论(The Ellsberg Paradox)、圣彼得堡悖论(The St. Petersburg Paradox)、双信封悖论(The Two-Envelope Paradox)。

  二、决策论与因果关系

  行动选项、状态与结果之间,行动选项与结果之间必须具有因果关系,而且行动选项不能与状态之间有因果关系。但行动选项即使与状态之间没有因果关系,有时仍可能具有证据关系。决策论中哲学家所激烈讨论的其中一个话题是,行动者是否应将行动选项与状态之间的证据关系纳入考虑。换句话说,一个理性的选择是否应在行动选项与结果的因果关系之外,考虑行动选项与状态之间的证据关系。这个问题可以透过纽康姆问题例示。

  纽康姆问题是:有位能力超群、精通心理学、认知科学与认知神经科学的预言家,提供行动者能赢得百万元奖金的游戏。有两个盒子,一个不透明,一个透明。透明的盒子里放1000元。行动者只有两个行动选项,他可以选择只拿不透明的盒子(称此选项为“一个盒子”),或是两个盒子都拿(称此选项为“两个盒子”)。在行动者做决策以前,这位预言家如果预测行动者拿一个盒子,那么他将在不透明的盒子里放100万元。但如果预言家预测行动者拿两个盒子,则预言家将不在不透明盒子里放任何东西。从过去的记录显示,这位预言家预测其他行动者决策的准确率达99%。现在预言家已经完成预测,已根据预测在不透明盒子里放或不放100万元,并且已离开游戏(预言家绝不会在决策后再回来改变盒子的内容)。行动者的理性选择是一个盒子或两个盒子?

  

  不少人的直觉认为,纽康姆问题中唯一理性的决策是拿一个盒子。因为如果我决定拿两个盒子,那么预言家很有可能(99%)也预测到我会拿两个盒子,所以我将只能拿到1000元。如果我只拿一个盒子,那么预言家很有可能(99%)也预测到我会拿一个盒子,所以我将拿到100万元。所以理性的选择当然是一个盒子。

  选一个盒子的思路诉诸了条件概率来指定世界可能状态。以P为主观概率函数,P(Y|X)代表条件概率:“若X发生,则Y发生”的概率。如果选择一个盒子,那么预言家99%预测一个盒子,所以条件概率P(预言家预测一个盒子|行动者选择一个盒子)=99%。同样,P(预言家预测两个盒子|行动者选择两个盒子)=99%。所以一个盒子的期望效用为99%×1000000+1%×0=990000;两个盒子的期望效用为1%×1000000+99%×1000=10990。一个盒子的期望效用远大于两个盒子的期望效用,所以理性的选择是一个盒子。主张一个盒子的哲学家认为行动者的选择成了预言家预测的证据,而这个证据信息是理性决策所必须考虑的。这个立场称为证据决策论(Evidential Decision Theory)。

  但是有不少哲学家主张,行动者应只考虑行动选项所产生的因果信息。在纽康姆问题中预言家既然已经做出预测并且离开游戏,那么不管行动者的决策为何,都不会改变盒子的内容。换句话说,行动者的决策不会溯及过去改变预言家做决策,也不会改变预言家已经准备好的不透明盒子。行动只会改变未来,但不能改变过去。这些哲学家承认拿两个盒子的决策的确有证据信息:拿两个盒子的决策是预言家预测两个盒子的证据。但是他们坚持证据信息不能取代因果信息的地位。因为条件概率包括了证据信息,所以主张两个盒子的哲学家主张使用反事实条件句的概率来计算期望效用,理由是反事实条件句的概率只考虑行动所因果产生的结果。以“X □→Y”代表“(反事实语气)如果行动者选择X,那么Y发生”,反事实条件句概率P(行动者选择一个盒子□→预言家预测一个盒子)=P(行动者选择两个盒子□→预言家预测一个盒子),P(行动者选择两个盒子□→预言家预测两个盒子)=P(行动者选择一个盒子□→预言家预测两个盒子)。换句话说,行动者的选择不会因果改变预言家的预测。因为可能状态的概率不会随行动者的行动而改变,行动者可以简单利用前面提到的优势原则,判断不论预言家的预测,两个盒子的结果总是比一个盒子好。如果预言家预测一个盒子,选两个盒子的结果(100万元+1000元)比选一个盒子好(100万元)。如果预言家预测两个盒子,选两个盒子的结果(1000元)也比选一个盒子好(0)。所以两个盒子是理性的选择。主张两个盒子的哲学家认为理性决策必须考虑因果信息,这个立场称为因果决策论(Causal Decision Theory)。

  斯塔尔纳克与刘易斯提倡使用反事实条件句概率作为因果决策论计算期望效用的概率。吉伯德与哈珀将使用条件概率或反事实条件句概率作为两种不同期望效用概念的区分。值得一提的是,刘易斯进一步利用依赖假设(dependency hypotheses)取代反事实条件句,依赖假设是行动者所关注的事物如何因果地依赖行动的最具体命题。行动者指定概率给每一个依赖假设,作为计算期望功效的权重。简而言之,相较于反事实条件句概率是一种因果概率,刘易斯的依赖假设概率将因果建立于世界状态中。

  纽康姆问题例示了证据决策论与因果决策论的区别,两者的主要争议在于因果信息在理性决策中的地位。这个问题同时也证明了因果性与决策论密不可分的关系。行动者在面临决策问题时,决策问题中的因果结构无可避免地影响理性决策。行动者如何更好地刻画决策问题的因果结构,以及如何更精准地预测行动选项所因果导致的结果,是决策论中最重要的问题之一。而因果模型可能是其中一种解决方法。

  三、决策论与因果模型

  因果决策论使用的反事实条件句概率,在判断上需使用可能世界概念,可能有较重的形上学负担。相对地,因果模型仅需使用概率与结构方程等数学语言,概念上较为精准。因为因果模型使用“干预”(intervention)作为判断因果关系的概念,有哲学家主张将决策论中的行动者的决策视为一种干预,进而将因果模型引入,作为行动者判断行为所产生因果结果的基础。从因果模型的角度看,如果运用干预的方式来测试两个变量之间的相关性,若发现两个变量之间概率上独立,那么在因果发现上就否定两个变量之间有因果关系存在。因果模型对“干预”的非概率定义如下:

  (因果模型)干预:I是X对Y的干预,当且仅当,

  (1)I造成X,

  (2)I排除任何其他造成X的原因,

  (3)I只能透过X影响Y。

  这个定义将“干预”解释为外在原本因果结构的事件。因果决策论可将行动者的行动,视为一种外在于因果结构的自由意志所引起,排除其他引起行为的原因,而且只引起行为而不直接导致结果。举例说明,假设存在一种肥胖基因,基因会引起带有这种基因的人想吃甜食,而且也会引起肥胖。假设行动者想吃甜食,但是更不想肥胖,行动者理性的行动是吃甜食或不吃甜食?这个决策问题的因果图如下:

 

  从证据决策论的角度看,想吃甜食是拥有肥胖基因的证据,而拥有肥胖基因将导致肥胖,所以不吃甜食是理性的选择。但是从因果决策论来看,如果将选择吃甜食视为被干预的结果,那么吃甜食才是理性的选择。因为干预排除了其他引起“吃甜食”的原因,截断了“肥胖基因”引发“吃甜食”的因果作用。从因果图可见,这就等于从“肥胖基因”到“吃甜食”之间的因果箭头是无效的,从而可观察的结果是“吃甜食”与“肥胖”之间没有规律性联系——因而,“吃甜食”是合理的选择。

  将行动视为干预,也能清楚厘清纽康姆问题中的因果关系。预言家是依据行动者的心理倾向(在预测之前)来预测行动者的决策,而心理倾向也因果引起行动者的决策。换句话说,行动者的心理倾向是行动者选择与预言家预测的共同原因。纽康姆问题的因果图如下:

  

  同样,如果把选盒子的决定视为被干预,因为干预会排除其他引起决定盒子的原因,从因果图上看,相当于是从心理倾向到行动者决策的箭头被删除。干预的结果是选择盒子与预言家的预测之间没有因果关系,所以行动者应选择两个盒子。克里斯托弗米克与克拉克格莱莫尔(Christopher Meek and Clark Glymour)主张,传统证据决策论与因果决策论的区分,是将行为视为条件化(conditioning)或干预的区分。

  将因果模型引入决策论后,在哲学上获得不少丰富的成果。例如,克里斯托弗·希契科克(Christopher Hitchcock)用因果模型中的因果图与干预概念解释一些因果决策论的反例。以及鲁本斯特恩(Reuben Stern)延伸刘易斯的依赖假设。斯特恩维持以依赖假设概率作为不同可能结果的权重,但将可能结果定义为依赖假设与干预结果的合取,能兼顾将行动视为干预的结果,能精准判断行动所因果地产生的结果的优点。

  不过,将因果模型运用于决策论中也有局限。因果模型有许多前提假设,其中之一是因果马可夫条件(causal Markov condition),这个条件不允许因果图中有因果循环(causal loop)。换句话说,如果运用在决策问题中,决策问题的因果结构不能有两个事件互为因果的情形。所以这个条件将限制因果模型在决策论中的运用。不少哲学家指出,在某些决策问题中,未必能总是将行动视为被干预的结果。例如,希契科克指出,在某些决策问题中,行动者能获得有关未来行动结果的信息,这种决策称为奇异选择(Exotic Choice)。这类决策问题显示将行动视为干预的结果,因果决策论将导致不符合直觉的理性决策。虽然似乎不能在少数奇异选择的决策问题中将行动视为干预的结果,但这不妨碍因果模型在决策论中的广泛应用。另外,因果模型包含因果贝叶思网络与结构方程模型两种方法。相较于最近哲学家只将因果贝叶斯网络运用在决策论,笔者曾指出因果贝叶斯网络无法在同时涉及不同因果结构的决策问题中运用,所以建议在这类决策问题中适合采取结构方程模型,协助因果决策论精准判断因果结果。

  结论

  决策论长久面临的难题是行动主体往往难以预测各行动选项会因果地导致何种结果。而因果模型是人工智能和大数据科学领域的新兴理论,能够帮助行动主体更精准地刻画与预测行动将因果地导致什么样的结果。因果模型能精准地掌握行动主体所面临的因果关系,并预测行为可能产生的结果,所以因果模型将成为决策论的必要工具(除了少数奇异选择的决策问题)。

  尽管因果模型在决策论中的应用仍属新兴领域,但因果决策论已有许多反例,例如著名的心理变态按钮等。在这些案例中,因果决策论推荐不符合直觉的行动选项。因果模型能否协助因果决策论回答这些问题,仍是待研究的课题。此外,如本文在前面提到的,在某些例如奇异选择的决策问题中,以干预来计算期望功效也会得到不符合直觉的行动选项。这其中引发的问题是,行动者的自由意志是否正如干预的定义一样,是外在于决策问题的因果结构,而且可以排除其他引起行为的原因?人的意志或意图引起行动,但意志与意图的基础仍是神经大脑活动,所以大脑神经活动可能也是引起行动的原因之一。因果模型如果将自由意志视为一种干预,而且干预是一种能排除其他原本引起干预对象的原因。但如果大脑的神经活动也会因果引起行动,视为干预的自由意志能否排除大脑神经活动对行为的因果力?如果是,这是否承认了自由意志可独立于大脑神经活动而存在?这些都是亟须哲学家回答的问题。

  本文为因果模型与决策论提供一个新的反思视角,并指出可能的具有建设性的发展方向。尽管因果模型相较于传统使用反事实条件句的方法更为精确与可靠,但因为复杂的概率运算与数据分析,尽管适合作为辅助人工智能的行为选择理论基础,却似乎在直觉上并不符合真实的人类思考行动模式。一方面,人类在真实场景有意识地进行思考和行动选择时,并不涉及复杂的概率与统计——所以,因果模型不适合作为描述性的决策理论基础。而未来在规范性与描述性决策论的整合上可能遇到困难。另一方面,以因果模型为方法的决策论也难以满足真实人类思考行动选择的需求。我们会很难想象理性要求行动者在面对每个决策问题时,都要处理庞大的概率运算与数据统计。作为规范性的决策论,对行动者过度苛求将使得理论自身丧失实际意义与可信度。总而言之,未来在因果模型与决策论的整合上势必将朝向简化理论与概率统计运算的方向发展。例如,将概率运算简化为简单的相关性判断、将不具明显相关性的变量忽略,或是将变量的可能取值范围合理缩小等,都是因果模型在决策论运用上的可能发展项目。

  最近具身认知的认知决策研究,也有不少研究成果影响到决策论的发展。例如在日常生活中较具简单性与重复性,但要求速度快的决策问题中,认知科学的研究中发现,大脑不总是精确预测未来可能的结果,而是在精确性与速度之间取得平衡。例如,在行动中逐步根据环境变化而改变行动的运动轨迹等。所以,具身认知的认知决策研究能提供简化因果模型的动机,一个较为简化但更有效率的因果模型,将是未来决策论与因果模型整合的有利发展方向。

  (本文注释内容略)

原文责任编辑:王志强

转载请注明来源:中国社会科学网(责编:)

扫码在手机上查看