近年来,人工智能大语言模型引发学术界热议。2022年,当ChatGPT刚刚流行时,乔姆斯基等人就在《纽约时报》发表《ChatGPT的虚假承诺》一文,指出了大语言模型和人类在思考方式、学习语言与生成解释以及道德思考方面存在着巨大差异,并认为大语言模型并不具备人类的语言和思维能力。相反,2024年诺贝尔物理学奖获得者辛顿在接受诺奖委员会官方电话采访时说道,希望他对语言能力本质和学习方式的见解可以被认真对待,因为大语言模型的成功从根本上驳斥了以乔姆斯基为代表的生成语法语言学家的“语言天赋论”。不过,大语言模型是否已具备人类的语言能力?或者,人工智能是否已能够比肩人类智能?
大语言模型运作的核心机制更多源于对训练数据的模式匹配或机械比对,而并非类似于人类所具有的逻辑推理能力。拉森(Erik J. Larson)在2021年出版的专著《人工智能的神话:为什么计算机不能像人类一样思考》(The Myth of Artificial Intelligence:Why Computers Can’t Think the Way We Do)中详细论证了当前人工智能和人类智能存在本质上的不同。具体而言,他指出人工智能研究人员建立系统所依据的推理机制主要是归纳推理和演绎推理两种逻辑。归纳推理指的是从个别事项推导出其共同特质,演绎推理指的是依据给定前提或先前知识推知个别事项特征。然而,人类推理机制不限于此,还有赖于另外一种由皮尔士(Charles Peirce)提出的重要逻辑形式——溯因推理。这种推理指的是一种基于结果寻求最佳解释的可能性推理模式,是一种“语境敏感的推理”。但很遗憾,溯因推理在目前的大语言模型中尚未得到足够重视或真正运用。
由于缺乏对溯因推理的运用,当前的大语言模型尚未具备真正的推理能力,自然还没有达到人类的语言和智能水平。这一观点也得到罗仁地(Randy J. Lapolla)等语言学家的呼应,他指出溯因推理的缺失直接导致人工智能尚不能模仿人类创造意义的机制。换言之,大语言模型在具体使用过程中偶尔会表现欠佳,这并不是因为缺乏对特定语言结构(句法学)和语义解码规则(语义学)的掌握,而是缺乏在特定语境下进行语用推论,进而识别说话人交际意图的能力。这种语用推论是当前语用学研究的重要内容,可以视为溯因推理在言语交际或自然语言理解中的实际应用。
众所周知,语用学的奠基人格赖斯(Paul Grice)曾提出会话含义理论。他认为,语言交际会话中存在听说双方自觉遵守的一套会话逻辑体系,即合作原则,具体包括质量、数量、关系和方式四类准则,大体对应“适量”“真诚”“相关”“清晰”等要求。同时,格赖斯也指出,在日常语言交际中,人们通常遵守但不总是遵守合作原则及其准则。出于特定目的,人们可以故意打破合作原则的要求,从而表达不同于字面意义的特定会话含义。听者需要基于语用推论识别会话含义所揭示的说话人交际意向,以确保交际的成功。例如,当说话人说出“学生就是学生”这类毫无信息量的话语,或者在开具学术职位推荐信时说出某人“字很漂亮”这类不够关联的话语时,我们通常需要考察具体语境,结合语用推论推知说话人隐含的会话含义,从而识别其真正交际意图。这种强调语用推论在会话含义识解中关键作用的研究构成了当前语用学研究重要流派,可统称为“推论语用学”或“格赖斯语用学”。
事实上,基于大规模语料数据的搜集和提取,大语言模型也可以识别出以上话语具有多种解读方案,但却很难基于语法规则、语词的字面意义和有限的上下文准确识别说话人意在表达的交际意义,其根本在于大语言模型语用推论能力的缺陷。而且,这种通过语用推论识别出的会话含义具有可取消性,可以在后续会话中发生调整或改变,这为大语言模型理解动态变化的交际意义带来挑战。总之,目前大语言模型的语用能力仍不完备,尤其是欠缺基于溯因语用推理推测说话人交际意图的能力。
语言是人类智能的重要表现形式,大语言模型语言能力的提升对于其进一步发展至关重要。由于溯因推理或语用推论制约着大语言模型的语言表现,人工智能的未来发展和突破可能有赖于在大语言模型开发中融入格赖斯语用学理论研究的成果,尤其是重视会话含义的理论研究与应用实践。具体而言,可以从以下两个方面努力。
一方面,要基于具体语言现象,创新并深化格赖斯语用学基础理论问题研究,辨别语用推论过程中语法结构触发和语用语境驱动之间的差异,厘清规约性语法编码、意向性语用推论和可能性语法触发语用推论之间的互动关系,探究会话含义式语用推论意义识别的过程和认知机制等。同时,可以尝试将理论思辨和语料库检索,以及认知心理学实验结合在一起,通过跨学科研究探求人类语言交际中会话含义识别的本质。
另一方面,要基于当前语义—语用界面和语法—语用界面研究的后格赖斯语用学前沿理论成果,在大语言模型训练中有效补充语用学理论知识和概念输入,尤其是以意向性语用推论为核心的会话含义推导过程的训练,以帮助大语言模型建立溯因式意义推导的工作机制。这样,在会话含义理论和后格赖斯语用学理论研究的加持下,大语言模型方有望掌握话语意义生成与理解的底层逻辑,从而逐渐接近人类的语言能力以及思维能力。
总而言之,在人工智能大发展的时代,语用学研究尤其是侧重意向性语用推论识别的会话含义研究将大有可为。当然,这也正是语言学和计算机科学等相关学科学者需要共同努力的方向,以期为推动大语言模型人工智能走向人类智能贡献力量。
(本文系国家社科基金青年项目“内嵌含义的语法驱动与语用限制互动研究”(20CYY049)阶段性成果)
(作者系大连外国语大学英语学院副教授)