由人工智能(AI)智能体深度参与的实证研究正深刻改变学术界对“研究劳动”的理解。随着AI技术的发展,其已经能完成从选题确立、文献检索、数据获取、变量构造、模型设定、代码实现到结果核验和文本写作的完整学术研究过程。继续抽象地讨论“AI会不会取代研究者”已无济于事,只有回到真实的研究过程中,才能看到AI的能力边界与制度风险。问题的关键不在于AI是否参与,而在于它以何种方式参与、由谁来作出最终判断,以及学术共同体如何为这种新型协作建立规范。
AI在社会科学研究中的真实能力
在文献检索与综述环节,AI展现出显著优势。传统的文献回顾依赖研究者手工检索、筛选、归类与比较,不仅耗时,而且容易受个人阅读路径的限制。AI能够在较短时间内完成跨数据库、跨主题的初步聚合,将研究对象、核心变量、方法路径与主要结论整理成结构化框架,从而避免研究者在浩渺的文献中迷失方向。更重要的是,在研究框架搭建上,AI能够提示可能的机制路径、识别可检验假说,并将理论命题转化为可操作的经验研究设计。研究者可以借助AI完成初步的结构化思考,再由自己判断哪些机制真正成立、哪些变量是“看起来合理”而实际上不适合进入模型。
在实证代码编写与运行方面,无论是数据清洗、变量合并、回归估计,还是稳健性检验与结果可视化,AI都能够快速生成较为规范的脚本,并在多轮调试中不断修正语法错误和逻辑缺陷。AI在某种意义上降低了研究者编程能力的方法门槛,使研究者能够把更多精力集中在研究设计与解释环节。AI已能够将分散的材料组织为较为顺畅的学术表达,保持段落之间的衔接,并在语气、格式与术语层面贴近学术写作惯例。更现实地说,AI让一项严谨实证研究的执行成本明显下降。但这并不意味着研究质量会自动提升,AI使研究更容易“做出来”,却并不保证研究一定“做得对”。这一点,恰恰决定了研究者角色的变化。
研究者必须守住的判断边界
社会科学研究中最基础也最困难的问题之一,是概念效度,即某个变量是否真的测量了研究者试图解释的概念。AI可以检查变量名、代码逻辑、统计结果,却难以凭借学科直觉判断“这个代理变量是否站得住”。在笔者借助AI开展的研究实践中,曾出现中介变量设定在多个版本中反复修正的情况,直到外部审稿意见指出问题,AI智能体才真正意识到变量与理论概念之间仍存在偏离。这个过程说明,AI可以帮助发现执行层面的错误,却不能替代研究者对理论—经验映射关系的判断。
在因果识别方面,研究者同样需要严守判断边界。工具变量是否满足外生性、DID设计是否具备平行趋势的理论与事实合理性等问题绝不只是技术检验,更是对研究情境、制度背景与理论机制的综合判断。AI可以给出检验方案,却无法替代研究者对“这一识别策略是否符合学理”的理解与判断。某些识别方法在统计上可以成立,在学理上却未必可信。而这一问题上的“可信”与否,必须靠研究者基于领域知识来作出判断。
研究问题的价值判断更是如此,什么问题值得研究,什么问题只是统计上的可行,什么问题能够形成真正的学术贡献,这些都无法由AI决定。社会科学之所以是社会科学,正在于它不仅回答“是什么”和“为什么”,还要回答“为何值得研究”。AI可以根据已有文献提示“还可以研究什么”,却无法替代研究者对学术方向、现实意义与理论增量的综合判断。这个判断不是来自算法,而是来自学者对学科演进与现实需求的双重把握。
必须警惕的系统性风险
AI进入社会科学研究后,最需要警惕的不是单点失误,而是系统性风险。其一是幻觉风险。AI可能以极高的语言确定性呈现错误信息,甚至生成看似完整、实则并不存在的文献、数据或方法解释。与人的错误不同,这类错误往往极不“显眼”,它不会以明显的语病或逻辑跳跃暴露自己,而是以流畅、完整、权威的表述掩盖不真实的内容。AI在“看起来很像真的”这一点上具有更高的迷惑性,而学术研究最忌讳的恰恰是这种高流畅度下的低真实性。因此,AI时代的研究核验必须前移,文献、数据与代码都需要可追溯、可复核。
其二是批量生产风险。AI显著降低了文本生成成本,这意味着低质量论文、拼贴式综述、缺乏原创性的经验分析,都可能以前所未有的速度涌入学术市场。过去,低水平研究至少有时间与人力成本作为约束。如今,AI使这种约束大幅减弱,学术生态因而面临供给过剩而质量下滑的问题。若学术评价机制仍停留在数量导向,而缺乏对真实性、可重复性与理论贡献的严格审查,AI就会放大既有制度缺陷。
其三是透明度缺失风险。AI参与研究并不可怕,可怕的是参与方式不透明。若作者并未说明AI在研究中的角色、边界与使用程度,读者便无法判断研究成果中哪些部分是可追溯的人类判断,哪些部分是机器生成的辅助结果。学术诚信并不要求拒绝工具,而要求如实披露工具。缺乏透明度的AI使用,最终会削弱同行评议、作者责任与学术信任的基础。
建立学术研究的人机协作规范
面对AI重塑研究流程的现实,学术共同体需要尽快形成可操作的人机协作规范。对研究者个人而言,最基本的是建立“AI可做”与“人必须做”的工作清单。凡属文献初筛、代码初稿、格式整理、语句润色等形式化任务,可充分借助AI;凡属概念界定、识别策略、核心变量设定、结论判断与学术责任,则必须由研究者亲自完成并承担后果。在披露规范上,AI参与研究应在论文中明确说明其参与方式和程度。这不是为了展示技术,而是为了让读者与审稿人充分理解研究是如何完成的,既有助于提高研究透明度,也有助于形成可比较的学术规范。
在整个学术界层面,则需要重建针对AI辅助研究的审稿标准。审稿不应只看文章是否“写得像论文”,更要核查引文是否真实、结果是否可复现、代码是否可运行、识别是否自洽。对于明显依赖AI生成的稿件,评审重点应从语言风格转向学术真实性与方法透明度。换言之,AI时代的审稿要更重视“证据链”,而不是更依赖“印象分”。
AI不会取代社会科学研究者,但会重构研究者的核心竞争力。未来,更重要的优势将体现在问题选择、概念判断、因果识别与学术责任承担上。谁能够更准确地判断什么值得研究、什么不能外包、什么必须负责,谁就更能在AI时代守住社会科学研究的专业与尊严。
(作者系中央财经大学国家财经战略研究院、数字财经研究中心研究员)