◇中国社会科学报记者 练志闲
在人工智能技术席卷全球学术界的浪潮中,生成式人工智能对学术研究到底产生了何种影响?英国华威大学社会学系奥古斯特·孔德讲席教授史蒂夫·富勒(Steve Fuller)在接受本报记者采访时表示,生成式人工智能不仅能处理海量文献,还能通过算法组合生成新观点。它既是探索“未被发现的公共知识”的利器,也是重构科学研究范式的革命性力量,而人类也需要在此背景下重新定义自身。
挖掘“未被发现的公共知识”
《中国社会科学报》:如今,生成式人工智能已经加入学术论文的撰写过程,学者应如何重新定位自己在知识创造中的角色?
富勒:该问题颇为重大。在当前学术出版体系中,多数已发表的学术论文可能很少得到引用,甚至可能都没人阅读过。这些未被引用和阅读的论文大多旨在助力作者获得晋升和终身教职,也可能是为了争取下一笔研究资金。
20世纪80年代,美国信息科学家唐·斯旺森(Don Swanson)认为,知识是公开的,但是由于知识分散在不同专业领域,因此从未产生过联系。交叉引用不同学科的研究成果,可以发现被忽视的关联。斯旺森将这种被系统性忽视的研究称为“未被发现的公共知识”。随着知识专业化程度的提高,这种“未被发现的公共知识”可能会越来越多,加上文献数量持续快速增长,这些知识被人工发现的可能性较小。
如今,学术论文更多地被学术出版商出售给生成式人工智能公司的数据库,使得其中的内容可以为新的论文提供参考。论文原作者可能得到认可,也可能被忽略,但这或许是更好地利用大量“未被发现的公共知识”的重要途径。
虽然给予作者适当的荣誉是现代学术奖励制度的核心,但在科学与人文社科发展史上,不乏一些见解在初次提出时未获充分认可,而需要在新的背景下重新展示与接受的案例,这正是生成式人工智能所能提供的新机遇。隐藏在这一切背后的问题是:知识生产是否必须经由人类主体?我个人对此持否定态度。因此,我也认为生成式人工智能可以与人类共同撰写甚至独立撰写学术论文。
人工智能的自主性逐渐增强
《中国社会科学报》:能否展开谈谈,为何您认为知识生产的主体未必是人类?
富勒:实际上,我并不认为这一观点十分激进。人工智能研究的终极目标,就是塑造出一种对人类具有深远意义的智能形态。因此,当人工智能在人类极为重视的知识领域达成这一目标时,也就不足为奇。
此外,我一直心存疑虑,人类是否真正充分挖掘并利用了数百年来创造、积累的所有知识?这是一个尚未有明确答案的问题。在这样的大背景下,人工智能的崛起无疑为人类知识体系的完善与优化带来了新的契机。它能够使那些原本隐匿于复杂数据与文献中的知识更加直观地展现在人类面前,从而让这些知识对其创造者——无论是人类还是人工智能——都发挥出更大的价值。因此,我并不反对将特定的人工智能程序列为“共同作者”,甚至在特定情境下,将其视为学术研究的独立作者。
然而,我也并非毫不担忧。我最为忧虑的问题在于,“超级智能”机器可能会逐渐演化出一种仅限于它们自身理解的交流方式。从理论层面分析,这种情况的发生并非天方夜谭。随着计算机技术的不断进步,人工智能将愈发擅长自我编程,进而逐渐摆脱对人类程序员的依赖,实现更大程度的自主性。这种自主性的增强,无疑为人工智能创造出独立于人类理解之外的交流方式提供了可能。一旦这种情况成为现实,人类与人工智能之间的沟通障碍将进一步加剧,知识传递与共享的难度也将随之提升。这无疑是我们需要密切关注并深入思考的问题。
《中国社会科学报》:人工智能可以成为学术研究的辅助工具,这一点很好理解。但人工智能如何独立完成一篇论文呢?
富勒:诚然,人工智能在现阶段通过搜索各类专业文献所呈现的“未被发现的公共知识”,依然需要人类进行确认。然而,我们不难设想,倘若人工智能的程序中融入了用于开展相关研究的常规性方法信息,那么它就能为人类如何开展相关实证研究提供指导。此外,若人工智能以机器人的形态呈现,它甚至可以自行开展研究。
在我看来,我们有必要对人类开展学术研究的方式有一种更为切合实际的认知。实际上,在大多数学术研究活动中,研究者往往都是对既有数据进行二次挖掘与利用,以及对已有观点进行重新整合与编排。至于学术论文中的新数据,其作用恰恰在于为这种数据的“循环再生”以及观点的“重构组合”提供契机。
学术论文要求引用大量的参考文献,这也确保了研究可以遵循上述模式,这与人工智能的研究模式存在着惊人的相似性。人工智能的信息处理能力突出,能够快速阅读大量学术文献。然而,研究人员可能存在时间和精力有限、在阅读文献时带有主观倾向等诸多局限性,导致无法对所有文献进行全面和深入的研读,从而忽视了重要信息。
就我个人而言,这一研究结果并不令人感到意外。回溯50多年前,当时相对初级、基础的计算机编程技术,对各类医学症状进行加权计算与综合分析,在疾病诊断领域就已经展现出了超越临床医生的实力。20世纪80年代和90年代,初级形式的人工智能就已被用于为“专家系统”编程,这些系统再现了医生诊断病人时所采取的决策路径。这些程序因不会受到误解或记忆错误的影响,往往比人类医生更为准确。
人工智能具有创新潜力
《中国社会科学报》:写作论文确实需要很多参考文献,但也需要发现“研究空白”,即创新点和突破口。这是人工智能可以做到的吗?
富勒:我认为原则上可以,甚至现在就已经具备一定的可能性。当我们谈论知识中的“空白”尤其是科学知识领域的空白时,指的是一种形式受限的无知。换言之,尚未知晓的事物是依据人们已经掌握的知识来界定的,这也是为何科学探索常常被描述为“解决问题”。即便是最具创新精神的科学家,例如爱因斯坦,也是遵循这样的方式开展研究工作的。然而,在这些极具创新性的案例中,问题往往超越了人们的知识基础。当以这样的视角看待科学创新时,就会发现它似乎正是人工智能胜任的事情。
事实上,早在20世纪80年代,人工智能领域的先驱之一赫伯特·西蒙(Herbert Simon)就开发了一系列名为“BACON”(以近代实验科学方法创始人弗朗西斯·培根的名字命名)的计算机程序,旨在从不同甚至杂乱的数据中发现经验法则。西蒙在设计“BACON”时,研究了伽利略、开普勒和波义耳是如何从现有的经验数据中推导出数学定律的。他运用这些科学家用来生成假设的技术(西蒙称之为“启发式技术”)进行编程,然后计算机对这些假设进行测试,直到发现正确的定律。
诚然,这属于水平相对较低的科学创新。但即便如此,由于“BACON”掌握了历史上发现此类规律的途径,其速度远超人类。尽管西蒙并未对“BACON”展开进一步深入研究,但他认为,人类和计算机一样,解决问题的能力在很大程度上是通过相关的背景知识和技能预先赋予的。从这一角度看,计算机编程与人类教育类似。