AI赋能哲学社会科学基础设施建设

2026-02-04 来源:中国社会科学网-中国社会科学报

微信公众号

分享
链接已复制
  人们都知道,新一代人工智能的发展条件有个三件套:数据、算法、算力。当然,这是最抽象层次的归纳。问题是,一旦进入实践的具体场景,如赋能哲学社会科学,三件套便不再抽象,而是成为实实在在的基础设施。那么,让新一代人工智能赋能哲学社会科学到底需要怎样的基础设施呢?为了简洁地理解哲学社会科学场景中人工智能技术创新与应用的结构,我们可以把抽象意义的三件套融入从下往上的实践场景(如图)。
  第一步,有数汇数,建设特色化数据集池。对哲学社会科学研究而言,既要有专业化的数据,还要能把数据汇集起来投入赋能式的特色化应用。既有的知识生产单位,如高校、科研院所、政府、企业、个人等都有自己的知识生产特色,如何保留自己的特色而不被基于大模型的人工智能味儿淹没?一个路径是,把自己的学科特色、学术特色、创新特色等融入喂给机器智能的数据,让其在与人类智能的交互中保留知识生产单位的特色。
  要做到这一点,先得有数据,有多模态、多来源的碳基(人类的)数据和硅基(机器生成的)数据,还得汇集数据,有数汇数即保留与延续。新一代人工智能技术的发展规律告诉我们,特色化有赖于有数据,且数据量越大可用的价值越高,特色越凸显。为了在汇集数据量与保留数据特色之间建立平衡,进而让特色化数据转化为可行的实践,需要选择适宜且行得通的数据汇集层次。目前,以知识生产机构为单位汇集数据可暂时兼顾数据特色与非特色之间的平衡。
  第二步,理数炼数,建设高质量机器智能。对哲学社会科学研究而言,机器智能输出的特色,不仅有赖于算法质量,更有赖于数据质量。高质量数据与非高质量数据的本质区别在于,前者是有专业深度的数据。专业深度,一方面是指学科化的数据,如对专门概念、命题、规则、规律等学科含义有精准识别的数据;另一方面还指与人类价值对齐的数据,如对来自不同宗教、意识形态、观念立场等有精准识别的数据。容易引起误解的是,流行的新一代人工智能基座模型也学习了学科数据,在输出中也貌似进行了价值对齐,也能输出专业化的表达,可那只是通俗意义上的学科化数据和价值对齐,对进行知识普及而言,可用;但对深化专业知识创新而言,这些依然是未经专业校准验证和价值对齐的数据。如何提高数据的专业深度?可行的路径是把专家知识代入数据。
  此外,哲学社会科学的知识生产与社会的发展阶段紧密相连,有专业深度数据的另一层含义是把社会需要的能力与知识联系在一起,精炼出与时代需求相适应的能力图谱,再把能力图谱与知识图谱进行有机关联,映射为对有专业深度数据的需求。要做到这一点,仅有哲学社会科学研究能力是不够的,还需要与数据科学、人工智能科学与技术甚至复杂科学等多学科进行协同,把能力图谱转化为教学和研究中的知识图谱,并在两者之间进行精炼式迭代,进而建设可用于教学科研以及服务的高质量机器智能。
  第三步,学习养成,建设互生性人机交互平台。对哲学社会科学知识生产而言,一支笔和一摞纸依然有用,对部分学科的深度创造而言尤其有用;更有用的是搭建可促进人类智能与机器智能产生正反馈的人机交互平台。换句话说,赋能哲学社会科学研究的基础设施,不再只是建设一架机器或一组机房,而是建设可用于人类与机器在知识生产领域相互陪伴、启发、参与、提升的平台。其中,人类与机器的互动实践也是提升平台赋能能力的有机组成部分。
  在这个平台上,能够激发人类智能的是让机器智能成为人类智能学习、记忆、推理的外挂,在外挂中汇集精准、可靠、演化、有深度的专业知识,不是像基座大模型那样媚人,不是替代人类的思考与创造,也不是抹平人类智能的特色,而是提供伙伴式、探讨式的输出,从而激发人类智能的创造力。与此同时,人类也不再像翻词典那样希望获得公认的回答,或获得确切的答案,而是把人类的批判性思考呈现出来与机器进行探讨,提升机器智能的批判性思维能力,进而让机器智能不只是作为外挂,还作为伙伴,成为类人的专业性学术伙伴。如此,让人类与机器在互动中互生演化,在机器激发人类创造力的同时,促进机器智能可靠性、精准性、进化性的迭代。
  第四步,蓄积涵养,建设赋能性数智生态。对哲学社会科学研究而言,知识生产的目的是加深人们对人类社会的认识,丰富人类的精神世界。机器作为与人类思考和行动直接交互的类行动者,已经成为人类社会无法回避也无需回避的有机组成部分,这是人类从未遇到过的格局,让如今的哲学社会科学知识生产面临着截然不同的挑战,其中包括机器智能对知识生产的参与。对此,涵养人机生态,需要在涵养中积蓄人类面向人机社会的认识,在人机环境里开辟人类精神世界的空间,创造人类生命、人类学习、人类劳动等人类意义,实现人机双向赋能的可持续未来。
  要做到这一点,也意味着哲学社会科学的知识生产从以前的专业生产活动转变为人机社会的基础设施建设,转变为以人类福祉为依归的服务于人类每一个个体的价值设置、观念设施、认知设施。知识生产也因此不再是知识精英的生产生态,而是人机社会面向人类价值的数智生态。
  与所有基础设施建设无法一蹴而就一样,赋能哲学社会科学的基础设施建设也面临着诸多痛点。其中,最突出的是缺乏有专业深度的数据,也是一般意义上的数据孤岛在赋能哲学社会科学基础设施建设中的基础缺失。而后是基座大模型的迭代速度与专业化应用之间存在数智鸿沟,一方面是基座大模型从以月为单位的迭代发展到以天为单位的迭代,哲学社会科学领域的学习者对专业应用的渴望不断积累;另一方面是在哲学社会科学领域还有相当一部分人拒绝接受人工智能赋能。一些机构重数据却不汇集数据,轻应用,更轻人机专业能力的双向养成。还有,因专业应用尤其是特色化应用基础设施的缺乏,使得有兴趣有能力接受赋能的哲学社会科学知识的学习者和生产者不得不与某个云平台深度绑定,既难以获得特色化的知识来源或知识服务去向,也面临被数据和知识收割的风险。
  简言之,要让人工智能赋能哲学社会科学,基础设施建设是学习养成、蓄积涵养的基础,而基础中的基础是有数汇数、理数炼数,把以人类价值为基础和依归的数据作为人类智能与机器智能交互的食粮,才有机会实现人类与机器在哲学社会科学领域的互生,推动以人类价值、观念、认知等为目标的知识生产和知识传播。
  (作者系北京大学博雅讲席教授)
【编辑:罗浩(报纸)王晏清(网络)】