人工智能因果关系是三个层级
经典统计学只关注总结数据,而因果关系可解释如何在不实际实施干预的情况下预测干预的效果,表达形式称为“反事实(counterfactual)”。反事实推理涉及假设分析(what-if),反映了现实世界运行模式的特有结构。
当试图回答反事实问题,即:“加入采取了相反的行动会发生什么”,因果模型的重要性就引人注目。对于任何人工智能来说,反事实问题都是最具挑战性的问题,解释效果的机制的问题,以“为什么”为典型,就是经过伪装的反事实问题。
人类经过500万到600万年的时间从类人猿进化而来,但是在大约5万年前,人类经历了认知革命(Cognitive Revolution),又称为“大跃进”,人类以神奇的速度获得了改变环境和提升自身能力的能力。学者们认为:人类祖先想象不存在之物的能力是一切的关键。想象和因果关系之间的联系是不言而喻的。而心理模型是施加想象的舞台,使我们能够通过对模型局部的修改来试验不同的情景。
因果关系的三个层级的认知能力:观察能力、行动能力、想象能力。
1. 观察能力:要求基于被动观察做出预测,统计学家通过收集和分析数据给出发生时间的概率。“条件概率”用于测算两种行为之间的关联程度。典型的关联度量方法,即“相关分析”或“回归分析”,具体操作就是将一条直线拟合到数据点集中,确定直线的斜率。深度学习的成果确实举世瞩目,但是主要认为任务实际并不困难。深度学习黑只是让机器具备了高超的能力,而非智能。DNN为拟合函数的复杂性增加了更多的层次,但其拟合过程仍然是由原始数据驱动。
2. 干预:干预比关联更高级,不仅涉及被动观察,还涉及主动改变现状。预测干预结果的一种非常直接的方法是在严格控制的条件下进行实验。准确的你因果模型允许利用第一层级的数据来回答第二层级的问题。
3. 反事实:数据顾名思义就是事实,但是数据无法告诉我们在反事实或虚构的世界里会发生什么,在反事实情况下,观察的事实被直截了当的否定。例子:“在弹性限度内,假如加在这根弹簧上的砝码重量是原来的两倍,弹簧伸长的长度也会加倍”(胡克定律)”,这样的物理定律可视为反事实断言。这一断言是从诸多研究者在数千个不同场合对数百根弹簧进行的实验中推导出来的,得到了大量试验性(第二层级)证据的支持。
哲学家使用“概率提高”概念定义因果关系,如果X提高了Y的概率,说X导致了Y。我们很清楚,前者只是增加了后者发生的可能性,而并非必然让后者发生。哲学家无一例外地使用条件概率来表示“X提高了Y的概率”,记做P(Y|X)>P(Y),但是“提高”是一个因果概念,意味着X对Y的因果效应;而“P(Y|X)>P(Y)” 只涉及观察和手段,表示的是“如果我们观察到了X,那么Y的概率就提高了”。但是,这种概率提高完全可能是由其他因素造成的,比如Y是X的因,或者其他变量(Z)是它们二者的因——这就是症结所在!这一形式表述将哲学家们打回原点,让他们不得不再一次尝试消除可能存在的“其他原因”。