近年来,学术界关于“数智化赋能社会科学”的讨论日渐增多,但多数讨论仍停留在用更强的算力处理更多的数据,用更好的算法发现更隐蔽的模式,用更快的速度完成更繁重的文献检索。这些进步当然重要,但它们本质上是在传统范式的框架内做量的提升。AI正在同时从数据、方法和认识论三个层面冲击哲学社会科学的根基,要求哲学社会科学研究者在深入思考的基础上,运用AI推动真正意义上的研究范式革命。
第一,数据革命:从小样本到全域数据。传统社会科学的数据采集高度依赖问卷调查、深度访谈和田野观察。数字化时代从根本上改变了这一格局。社交媒体上每天产生数十亿条交互记录,电子支付系统积累了几乎所有人的消费行为数据,城市传感器网络实时捕获人口流动和环境变化信息。社会科学家现在面对的不是“数据不够”的问题,而是“数据太多、维度太高、变化太快”的全新挑战。但数据革命的本质不只是“更多数据”,而是从根本上改变了社会科学的观察粒度。更深层的影响在于,全域数据暴露了真实社会的复杂性远超传统理论模型的处理能力,进而呼唤方法论层面的根本变革。
第二,方法革命:从统计推断到计算实验。在以经济学为代表的社会科学研究中,统计推断是一种核心方法,但它只能分析已经发生的事情,无法回答“如果情况不同会怎样”的反事实问题。AI带来了计算实验的可能性。在虚拟环境中构建包含大量异质智能体(Agent)的社会系统,设定不同的初始条件和政策参数,观察系统动态演化的“计算实验”方法为社会科学研究增加了一个全新的维度。计算实验让社会科学第一次拥有了自己的“实验室”——可以在其中反复试验、控制变量、比较方案。关键的质变在于大语言模型(LLM)驱动的多智能体系统中,Agent具有自主决策能力,使得宏观现象从微观交互中“涌现”,成为复杂系统的“自然”产物。
第三,认识论革命:从观察世界到“生成世界”。传统社会科学的核心方法论范式是“观察—归纳—理论建构”。AI社会模拟器开启了一种全新的认识论可能:通过“生成”一个“社会”来理解社会。LLM驱动的Agent具有类人的认知、推理和决策能力,其行为是基于对环境的“理解”而“生成”的,可以产生研究者未曾预设的新奇行为和涌现现象。这是从“解释已发生之事”到“模拟可能发生之事”的范式跃迁。从马克思主义的方法论角度看,这种转变有其深层合理性——马克思强调社会经济现象是人的实践活动的产物,而非抽象规律的自动展开。计算实验恰恰是从人的具体行为出发,通过模拟实践活动的复杂交互,观察社会经济规律如何从实践中生成,这在方法论上与历史唯物主义的逻辑具有内在一致性。
同时,AI还在四个维度上带来学术研究的重构。一是从“代表性个体”到“异质性群体”。以经济学为例,主流经济学长期依赖“代表性个体”假设。但真实社会中不存在“理性人”,重大社会现象恰恰是由个体之间的差异性和互动性驱动的。AI驱动的多智能体系统天然支持大规模异质性建模,每个Agent可以具有独特的特征和决策偏好。这意味着社会科学终于可以系统性地研究那些传统模型遗漏的关键问题:少数个体如何通过网络效应改变全局?边缘群体对政策的响应为何与主流群体截然不同?社会规范如何在局部互动中自发生成和演化?
二是从“事后解释”到“事前推演”。传统社会科学的核心工作模式是事后解释,而AI社会模拟器使政策“预演”成为现实。决策者可以在虚拟社会中同时测试多个政策方案,比较短期效果和长期后果。如清华大学AgentSociety平台已成功模拟了UBI政策效果、信息传播治理效果等,结果与真实世界高度一致;复旦大学SocioVerse在美国大选预测中,34万智能体的预测准确率超过90%。
三是从“学科分立”到“计算统一”。学科分化导致经济学、社会学、政治学、心理学、新闻传播学等学科各有方法论传统。AI社会模拟器提供了一个统一的计算框架,可以在同一个模拟环境中同时研究经济行为、社会互动、政治态度、心理变化和信息传播。这将更贴近真实社会中上述维度不可分割的现实,也有望推动社会科学从学科分立走向问题导向的整合。
四是从“静态快照”到“动态演化”。传统社会调查捕获的是某个时间点的社会“快照”。AI模拟生成连续的、高时间分辨率的社会动态过程,可以观察社会系统从一个稳态到另一个稳态的完整转换路径,包括临界点、相变、路径依赖等非线性动态特征。社会变迁不是从状态A直接跳到状态B,会经历复杂的中间过程——有些是渐进的,有些存在突变;有些是可逆的,有些一旦跨过临界点就不可逆。
我们必须清醒地认识到,AI并不是万能的。AI可以对社会科学研究产生颠覆性的影响,但我们需要诚实地划定能力边界,明确AI不能做什么。
缄默知识不可模拟。AI精于处理编码化的外显知识,但对“意会”的缄默知识,如文化底蕴、隐性规范、社区记忆、情感逻辑等常常解释乏力。研究者仍然需要通过田野调查、深度访谈、参与式观察等传统方法去触碰那些无法被数据化的社会现实,做到返本开新。
价值判断不可委托。社会模拟器可以告诉研究者政策会导致的结果,但它不能告诉我们哪个结果更好。关于公平与效率如何取舍、多数人的便利与少数人的权利如何协调等重大价值判断是人主体性的表现,不能也不应该委托给机器。
系统性偏差必须警惕。LLM是在人类产出的文本数据上训练的,这些数据本身携带着特定文化、时代、群体的偏见。复旦大学SocioBench评测显示,个体行为模拟精度总体仍低于40%,欠发达地区模拟精度更低。规模大不等于更真实,“精确的错误”比“模糊的正确”更危险。
方法论互补而非替代。AI社会模拟不是要取代传统社会科学方法,而是作为重要补充。最理想的研究范式是:计算实验产生假说,传统方法验证假说;传统方法发现困惑,计算实验拆解困惑,两者互补共进。
(作者系清华大学马克思主义学院教授)