首页 >> 中国史 >> 动态
数字人文学与历史学的碰撞融合 ——厦门大学“民间历史文献与数字人文暑期学校”综述
2021年11月14日 07:21 来源:中国社会科学网 作者:李进辉 字号
2021年11月14日 07:21
来源:中国社会科学网 作者:李进辉

内容摘要:

关键词:

作者简介:

  中国社会科学网讯 为加强历史学与数字人文学的学术合作与交流,拓展学生的学术视野,提升掌握和运用数字人文技术的能力。8月30日到31日,“民间历史文献与数字人文研究生暑期学校”在线举办。暑期学校邀请了11位来自中国台湾、德国、美国的历史学者和数字人文学学者授课,来自加州大学洛杉矶分校、新加坡国立大学、香港科技大学、上海交通大学、复旦大学、厦门大学马来西亚分校及本校约30名学员参加了本次暑期学校。会议由厦门大学研究生院主办,厦门大学民间历史文献研究中心承办、厦门大学历史系协办。

  运用新科技进一步深入研究中国传统社会

  厦门大学历史系主任张侃教授主持开幕式并致辞,厦门大学历史系特聘教授郑振满作《民间历史文献与数字人文学》的主旨报告,论述了运用数字人文推进中国社会历史研究的必要性和重大学术意义。

  近年来,海量民间历史文献的发掘使得中国历史研究越来越接地气,揭示了诸多前人未见的历史现象。但民间历史文献研究也受到一些质疑,诸如碎片化、过多的历史细节反而模糊了大历史叙述等等,从而造成民间历史文献研究陷入瓶颈,而民间文献与数字人文学相结合,是一个可能的突破方向。郑振满认为,民间历史文献研究应逐步从找资料转向读文献,理解历史上的文字传统对民间社会的深刻影响。民间历史文献学的任务不仅是认识前人未能揭示的史实,更要理解文献的生产、制作、使用与流传的过程。他提出以下需深入探讨的维度:

  第一,民间历史文献的丰富性和复杂性。由于文字传统的深刻影响,民间社会创造了丰富多样的历史文献资料。不同类型的文献在日常生活中有不同的意义,我们对民间文献要有总体认识,尽可能重建文献系统。我们最近整理永泰契约文书,发现有不少“包契纸”与包内契约已经无法对应,可见其文献系统已经被扰乱了。为了重建原来的文献系统,就需要利用数字人文学的研究方法。我们目前主要通过提取契约文书的人、事、时、地、物等“源数据”,寻找其内在联系,还原其原有系统。为了实现这个目标,需要有全文数据库,建立跨文本的联系。更重要的是,与契约相关的各类其他文献,例如碑刻、族谱等民间历史文献,必须纳入同一数据库,才可以深入揭示契约文书的历史文化内涵。

  第二,民间历史文献的历史源流。文字传统进入普通百姓的日常生活,可能反映了中国社会的重大转型。各种不同类型的民间文献,在中国各地出现的时间和发挥的作用都不尽相同,我们需要通过实证研究,为各类民间历史文献建立一个“历史年表”,揭示这些民间文献在中国各地出现的年代和形态,探讨这些文献形成的历史意义。例如:人们何时开始修族谱?何时开始制作碑刻?契约是如何被制作及利用的?仪式文献又是如何产生的?简而言之,就是探索各种文献本身的历史。在这方面,建设数据库和数字人文学方法可以为我们提供分析工具和解决途径。

  第三,民间历史文献的语境。各种民间历史文献的形成、流传与使用,涉及当地的社会文化网络与权力关系等,需要在具体的历史情境中去理解。因此必须借助于跨文本和超文本的数据库,引入各种相关资料,重建历史现场,在更为广阔的学术视野中解读民间历史文献。

  第四,民间历史文献与经史传统。1905年废除科举制度之后,经史传统日益衰微,但在民间文献中得到延续。通过数字人文学研究方法,可以揭示二者之间的历史联系,寻找贯通中国历史的整体解释。在数字化时代,我们可以确立“以人民为中心”的马克思主义唯物史观,重新书写中国历史。

  最后,希望以后有机会可以进行实地调研,通过了解日常生活中的文字传统,探讨民间历史文献与数字人文学相结合的发展前景。

  如何研究民间文献?如何利用民间文献进行历史研究?哈佛大学宋怡明教授作了《永泰契约文书研究》的主旨报告,他以永泰文书为例,提出初步研究构想,强调了利用民间文献进行历史研究的独特阐释价值,并基于从大量民间文献获取信息所面临的困难,提出了对数字人文学的期待。他认为永泰文书的优势在于包含人物、事件、时间、地点等非常具体的信息,研究者可以据此撰写出一个多层次的故事,描述某一个家庭、家族、社区的历史,从“小历史”去理解社会经济文化之间的关系,进而研究区域性发展的“大历史”。他以永泰珠峰村、漈头村的故事为例,指出这样的研究并不是“碎片化”,而是有其大历史阐释的意义。

  对于数字人文学,宋怡明提出了自己的三点期待:1.希望数字人文学能“创造”新的信息,帮助历史学者发现更多的关联性。2.希望数字人文学能实现各种关系的可视化,诸如财产转移过程等等复杂流程的可视化。3.希望能借助数字人文学将某一家人的日常经济生活分析出来,批量编制出大量的故事,进行多层次、多脉络的分析。若能实现这些目标,历史学者可以基于这些数据提出一些更好的问题。宋怡明认为民间历史文献研究的优势在于给出一种“中等规模”的历史解释。其基础就是大量的历史故事,这些故事不需要尽善尽美,但需要数字人文学将这个流程自动化。民间历史文献学和数字人文学目前都面临各自的转型期,两个学科进一步加强合作,可以促进彼此的发展。

  数字人文学在与历史学的结合上已经取得了哪些重要的进展?未来又存在什么样的可能性?台湾大学资讯工程学系特聘教授项洁以《历史档案的数位化与多重脉络分析》为题,简要介绍了近年来其团队的工作情况。他指出,数字人文是一个跨领域的学问,在处理、获取、分析、呈现、解读资料上都需要不同于传统的方法,可以观察到一些以前无法看到的现象。和传统人文研究相比,数字人文像是一架可以鸟瞰资料的直升机,可以发现和观察史料之间的关系和脉络。但数字人文并不是要取代人文研究,而是提供一个掌握大量资料的方法,现象的诠释还是人文学者的工作。这就需要对资料整备,进行标记,进而分析。系统可以提供的文本脉络(一组文件之间的脉络)和可解释的脉络(所提供的脉络应可以被人文学者观察和解释),但是无法提供非文本的脉络,诸如使用者的知识、背景、偏好等等。而这正是人文学者解释、诠释的巨大空间。

  项洁重点推介了台湾大学的DocuSky系统。DocuSky 数字人文学术研究平台的研发,是为了服膺人文学者的个人性,兼具收纳多元媒材的标准性,满足研究需要的多样性,提供学者在平台上建置符合国际标准格式的个人云端数据库,并利用平台上所提供的各种工具,进行个人文本的格式转换、标记与建库、探勘与分析,以及可视化观察、 GIS 整合等学术研究工作。学者可以利用这个系统、自建数据库,利用其提供的工具来满足自己的研究需要。项洁以历代宝案脉络系统、台湾省议会史料总库为例,展示了该系统的利用方式和数字人文研究方法,并欢迎大家多多使用DocuSky系统。目前,利用DocuSky工具已经产生了1600篇左右的论文,充分展现了其广阔的运用前景。 

  科技与人文相结合

  在过去的二三十年中,国内外已经有了大量的数字人文学的尝试,也开发建成了许多成熟的数据库和数字人文工具,像DocuSky、CBDB、THDL、Markus、LoGaRT和Palladio等等。应邀授课的专家们分别介绍了这些数据库和数字人文工具的理念、现状及其使用方法,并以实例展示了数字人文学研究的诸多可能性。

  台湾师范大学李宗翰副教授介绍了CBDB,即中国历代人物传记资料库。CBDB迄今包含了49.1万条各朝代的人物信息。CBDB以“历史社会网络分析”为取向,着重“群体传记学”,注重某一个群体在大的历史时空范围内的生命经验。李宗翰以南宋权相与取仕地域性的关系、宋代莆田进士的社会网络为例,展示了CBDB的使用方法。CBDB可以将多个不同史料的信息整合到一个表格之中,打通不同史料的界限,跨文本思考人物关系。李宗翰强调,人文学者需要提出有意义的问题才能用好这些强大的数字工具,否则只会得出无意义的结果。

  德国柏林国立图书馆何浩洋研究员介绍了Markus半自动文本标记系统。Markus可在文本中自动标记人名、地名、年号及官名等关键词。上传用户自定义的关键词,或使用由系统提供的关键词探索功能,可以实现任意语言文本的标记功能。完成文本标记后,可以在相关参考文献的帮助下阅读文本,也可以比较包含相同关键词的段落。由Markus标记的关键词,可以和人物传记资料(如CBDB)、地理信息等数据库链接,也可以将标记后的文本上传至相关文本分析工具或可视化平台(如DocuSky),作进一步的分析。

  台湾大学数位人文研究中心的洪一梅博士介绍了THDL和DocuSky数位人文学术研究平台。THDL,即台湾历史数位图书馆,是台湾地区数字人文的基础数据库。它包括全文、诠释资料(metadata)与少数影像资料,主要是台湾各级学术机构典藏的官方档案资料和各类民间文书等等第一手珍贵史籍资料。DocuSky的核心概念是个性化的服务、协同合作的机制和开源链接。在个人化的服务方面,使用者除了可以使用公用的资料库外,最核心的功能就是方便研究者建立自己的数据库。很多学者的研究范围较小,数据量较少,数据库建设成本极高。在DocuSky的帮助下,就可以超低成本实现。学者在建库之后,可以实现全文检索、后分类、标记、统计分析、视觉化观察等等。洪一梅以澎湖厅古契书为范例文本,全流程指引学员们系统操作,实操资料检索、搜索、下载、一键导出至DocuSky建立云端资料库,并学习云端资料库的运用。

  德国马克斯·普朗克科学史研究所陈诗沛研究员介绍了其研究所研发的LoGaRT地方志工具。它为全文数字化方志提供了鸟瞰分析视角,让研究者跳脱“浏览、检索、单点阅读”的数据库使用窠臼,并简化由方志提取历史大数据、进行统计分析及可视化的过程。陈诗沛以410套已全文数字化的哈佛燕京图书馆藏珍稀方志为例,全流程带领学员实践LoGaRT的各项功能。LoGaRT可以按照书籍、章节、页面全文、图像和研究者自定义的标记主题进行检索,检索完成之后,可以利用提供的各类数据分析工具进行数据分析。

  台湾大学曹德启博士介绍了如何把手中的资料表格导入DocuSky建立和完善云端数据库的具体操作流程。把以DocuSky的Metadata规范做好的资料元数据表格导入DocuSky之后,可再利用其内置的诸多工具来分析文本并开展研究。目前绝大多数数据库只能满足简单的检索功能,难以满足研究者个性化的需求,而DocuSky则可以帮助研究者方便地打造自己的个性化数据库。曹德启以澎湖厅古契书为范例,展示了从开放的线上资源取得研究资料到整理为Excel表单(Metadata与全文)、再到导入DocuSky建立个人数据库的全过程。使用者首先要设计Metadata数据表。其设计思路与传统史学的资料卡片方法相通。本质上就是将史料中的各种信息填入各种分类标准中。利用DocuSky平台上的“表格文本转换工具(新版)”便可以实现自设表格与DocuSky标准表格的链接。

  彰化师范大学胡其瑞助理教授简介了依托DocuSky平台的多种标记方法的应用。他以澎湖厅古契书为例,指导学员在DocuSky平台上进行“文本批次标记工具”操作。

  DocuSky常用的标记方法,第一种是Markus,第二种方法就是使用DocuSky自带的批次标记工具,在xml文档上直接进行标记,在Excel中以列表整理待标记的词汇与词汇类别,研究者可通过该工具将Excel与xml结合进行标记,达到快速批次标记的目的。除了标记系统,胡其瑞又介绍了标记与词汇分析工具Palladio。DocuSky可以首先进行词频分析,然后导入Palladio系统,对文本的词频进行分析,最终实现可视化。

  本次暑期学校课程内容精,信息量大,操作性强,涵盖了DocuSky、CBDB、THDL、Markus、LoGaRT、Palladio等多种数据库和数字人文工具的基本情况与使用方法,为学员们展现了数字人文学发展的现状和巨大的研究潜能。

  (厦门大学历史系 李进辉/供稿)

作者简介

姓名:李进辉 工作单位:厦门大学历史系

转载请注明来源:中国社会科学网 (责编:郭飞)
内容页广告位-中国与世界.jpg

回到频道首页
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们