人工智能赋能历史研究

2026-01-07 来源:中国社会科学网

微信公众号

分享
链接已复制
  中国社会科学网讯(记者王广禄)1月5日,由南京大学历史学院数智史学实验室主办的南京大学数智文献处理平台暨近代红色资源库发布会在南京举行。
  据悉,南京大学近代红色资源库由南京大学、南开大学、山东大学、华中师范大学历史学科师生依托南京大学数智文献处理平台打造,收录的历史文献以中共党史、中华人民共和国史和20世纪中国革命史为为主,另有部分民国时期相关史料。在数量上,数据库目前收录文献2600余件,合计约130万页、11亿字,并持续更新。数据库所收录的文献类型多元、语种多样,涵盖文件汇编、日记、年谱、文集、回忆录、报刊等种类以及中、英、日、俄等语言。在数智文献处理平台的功能支持下,所收录的文献资料以完成结构化目录,并支持全文检索、跨语言检索,所有外文文献均采用AI技术进行翻译,为深化理论研究奠定了坚实文献基础。
  “面对多形态多模态的史料,史学研究者大多面临三个突出的文献使用问题:文献识读与转录、跨语言、信息搜集与检索。”实验室负责人、南京大学历史学院助理教授金伯文介绍说,南京大学数智文献处理平台基于生成式大语言模型打造的资源库通过ORC增强和智能优化,将非结构化内容数字化,进行语义校正与漏识补全,确保文本标准化;能够快速准确地进行多语种翻译,并结合上下文还原历史语境;依靠强大的翻译能力和自然语言能力,支持跨语种检索和语义检索,实现了史学文献识别、编目、检索以及人机交互、写作的高度智能化,多类型文献入库后可一键共检,AI智能检索超越关键词搜索、从“匹配字符”逐步迈向“理解语义”。
  基于上述平台建设的“蒙元史多语种文献—穹庐文库”,在推动具有显著跨学科、多语言特征的蒙元史研究方面进行了成功实践。南京大学铸牢中华民族共同体意识研究基地首席专家华涛表示,人工智能技术运用于蒙元史研究,使学者在使用蒙古文、藏文、波斯文、阿拉伯文、突厥文等多语种史料时更为便利。以南京大学历史学院教授刘迎胜负责的中国历史研究院“绝学”学科扶持计划2025年度资助学科——突厥学研究为例,“该平台基本解决了突厥文的翻译问题,突破语言障碍,为深化突厥学研究解放了大量人力、奠定了良好基础。”
  谈及人工智能时代的史学研究,南京大学历史学院院长梁晨认为,人工智能在具身体验、人际关系、集体记忆、集体价值观等方面不具有优势,但可以极其高效地处理规范性的基础性研究任务,从而解放人脑,使人们在学术研究中得以有更多精力思考更为复杂、更具有深刻价值的学术问题。在人工智能推动的历史研究中,如何与AI对话、如何使机器的工作体现正确价值导向,对学者自身专业能力与深度思考提出了更高的要求。
  华中师范大学中国近代史研究所所长马敏同样表示,数字人文、数字史学浪潮方兴未艾,生成式人工智能技术与历史学结合,已经展现出深度赋能史学研究的巨大潜力。数字史学已不仅仅是一种手段、工具或者方法,而正在成长为一门新兴的史学分支学科。要加强学术合作和资源共享,共同推动数字史学发展,让人工智能技术使古老的历史学科焕发学术青春。
  南开大学历史学院杰出教授李金铮对南京大学数智文献处理平台暨近代红色资源库的推出表示祝贺并提出,该资源库将生成式人工智能技术运用于中国近代红色资源的整理和数据库建设,在国内外产生了强烈反响。平台和资源库对于推动中国近现代史尤其是革命史研究具有革命性的意义。希望继续扩大文献来源、提高容量,建设成为最权威的红色资源数据库。
  “历史学者的优势是史料。人工智能技术的引入,让历史学者能够更充分地发挥占有史料、搜罗史料的优长,让所有的史料融汇成为结构化的数据,不仅助力历史研究,更能够反哺其他的数字人文学科。”金伯文说。
 
【编辑:】