权威语文辞书是语言文字规范化的重要工具和文化传承的重要载体,是文化建设的重要组成部分。数智时代,权威语文辞书既迎来了大数据、人工智能等技术带来的机遇,也面临着大语言模型对传统知识获取方式的冲击。同时,人民群众也对辞书的内容、形式和使用体验提出了更高要求。对此,权威语文辞书必须坚持守正创新,既要坚守根本,又要与时俱进。如何在坚守权威语文辞书根本价值的同时实现转型升级,成为辞书学界亟须解决的重要问题。
守正:坚守权威语文辞书的根本价值
数智时代,权威语文辞书必须坚守其根本价值。守正不仅是对传统编纂理念的继承,更是确保辞书在新时代发展中保持权威性和公信力的关键,其根本价值主要体现在思想性、规范性、科学性、时代性四个方面。
一是要坚守权威语文辞书的思想性。思想性是权威语文辞书的导向价值。辞书不仅记录语言事实,还承担着传承中华优秀传统文化、培育社会主义核心价值观的重要使命。在辞书编纂过程中,要注重挖掘和阐释词语所蕴含的文化内涵和价值取向,积极传播正确的思想观念和价值理念。特别是在释义和例句选取方面,体现时代精神,弘扬社会主义核心价值观,引导公众形成正确的历史观,坚决批判和抵制各种错误思潮,充分发挥辞书在文化传承和价值引领中的作用。
二是要坚守权威语文辞书的规范性。规范性是权威语文辞书的基础价值,贯穿于编纂过程和内容呈现。在编纂过程中,要建立严谨的制度体系,从团队组建到词条编修、审校、排版印刷,每个环节都需严格把关,确保质量可控。在内容规范方面,辞书必须严格执行国家语言文字标准,准确呈现字形、读音、笔画笔顺等基本要素,并对尚未规范的语言现象发挥示范引导作用。
三是要坚守权威语文辞书的科学性。科学性是权威语文辞书的核心价值。辞书编纂必须以严谨的语言学理论为指导,运用科学方法对词语进行历时和共时考察,既要分析语义演变,又要把握实际用法,避免主观臆断和片面解释。同时,辞书编纂需建立在广泛翔实的语料基础上,按照科学分类原则对词汇进行系统化梳理归类,同属一类的条目措辞一致,避免分歧;条目内容编排上信息的呈现顺序要统一、条理分明;释义和例句确保其准确、典型,既反映词语使用的客观规律,又满足社会语言生活的实际需求。
四是要坚守权威语文辞书的时代性。时代性是权威语文辞书的动态价值。语言是时代的镜子,辞书编纂必须紧跟时代步伐,及时反映语言的新变化和新特点。一方面,要积极吸纳最新的语言文字规范标准。另一方面,要密切关注社会发展中涌现的新词新语,特别是在治国理念、文化传承、科技创新、社会发展等重要领域出现的新概念和新表达。例如,“文脉”“新质生产力”等反映时代特征的词语都应及时收录,使辞书真正成为时代发展的见证者。
数智时代,权威语文辞书只有坚守这些根本价值,才能在创新发展中始终保持正确方向,从而具备服务社会、传承文化的基础。
创新:数智赋能下的转型升级
守正是基础,创新是关键。权威语文辞书的创新,需以用户需求为中心,在编纂模式、服务模式、传播生态、内容形态上与时俱进。
一是创新权威语文辞书编纂模式。大数据、人工智能等技术为构建“语料驱动、自动编纂、智能审校、编辑核准、权威审定”的人机协同编纂新模式提供了数据基础和技术支撑。以GPT、DeepSeek等为代表的大语言模型经过海量语料库训练,积累了丰富的语言知识,在辞书编纂诸多环节可以提供智能支持,提升辞书编纂效率。例如,在收词与释义环节,大语言模型基于海量语料能够自动识别新词、热词及其使用场景,并形成初步释义,为辞书编纂人员提供参考。在“旧词新义”这类辞书修订的老大难问题上,大语言模型可以自动为每个词条义项划分和释义提供合理化意见建议。在配例环节,大语言模型可以自动生成既符合语言规范又兼具代表性的例句,达到自编例句和改编例句近似的效果。比如,对于“内卷”这一网络热词,大语言模型可生成其在学术、职场、社交媒体等不同语境的例句,为辞书编纂者提供多样化的素材参考。在审校环节,大语言模型可以辅助辞书编纂人员对词条内容中精准识别体例不当、释义偏差或循环释义、逻辑矛盾等问题提出审校建议。此外,结合检索增强生成等前沿技术,大语言模型能够实时检索权威语料库和外部搜索引擎,减少生成内容的“幻觉”现象,从而有效弥补模型自身的缺陷,确保生成内容可追溯、可解释、可信赖。
二是创新权威语文辞书服务模式。为满足新时代人民群众日益增长的语言文化需求,必须不断创新权威语文辞书的服务模式,既要助力智能化辞书的创新发展,又要强化辞书语料库的基础建设。一方面,要积极探索人工智能技术增强辞书知识服务的能力,推动权威语文辞书智能化发展。传统的纸质辞书受限于篇幅和更新频率,难以满足用户个性化、多样化的需求。而借助人工智能技术,可以打造更加智能化的新型辞书。例如,开发集语音查询、释义解读、例句演示、文化扩展等功能于一体的智能化学习词典,或是针对不同年龄层、不同学习需求的用户群体,打造个性化的专业化数字辞书产品,不断提升辞书的知识含量和服务水平。另一方面,要强化辞书语料库平台建设,为人工智能技术发展贡献辞书学界的力量。高质量语言数据是人工智能技术发展的重要基石。辞书作为专业语言数据的集大成者,蕴藏着丰富的词汇、语义、语法等信息,是训练人工智能模型的宝贵资源。例如,使用医疗古籍辞书的黄帝中医古籍大模型、使用现代汉语学习型词典的桃李教育大模型、使用双语学习型词典的子曰大模型等,都是将辞书语料库与人工智能技术深度融合的成功案例。未来,要进一步加强辞书语料库平台建设,推动辞书资源的数字化、标准化和开放使用,促进权威语言数据资源在人工智能技术发展中的广泛应用。
三是创新权威语文辞书传播生态。辞书传播也要拥抱新技术、打造新生态,其中融合创新是关键。要以数字化、智能化为驱动,将传统辞书资源与现代化功能相结合,拓展内容传播载体,形成多样化辞书形态和品类,创新辞书应用交互方式。网页、电子书、移动端、小程序、电子屏、信息亭、穿戴设备等辞书内容传播载体,都可以成为承载辞书内容的新平台。从实践和发展的角度看,目前权威语文辞书的传播载体建设还有很大的提升空间。因此,要积极推动辞书融合创新,建设新型辞书载体,推进辞书内容、品类、载体、应用的深度融合,促进辞书逐步从静态纸质资源向动态人机互动转变,着力打造权威语文辞书服务新生态。
四是创新权威语文辞书内容形态。创新服务模式和传播生态的构建,亟须与之相匹配的内容形态创新作为支持。第一,全媒体技术深度融合推动辞书形态突破传统纸质载体的物理边界,将融合文本、图像、音频、视频等多媒介资源,构建多维动态的词汇语义网络,突破传统辞书呈现形式单一的局限。第二,辞书内容需与装载设备传感器接口深度融合,以支持人与辞书的多模态交互,提供键盘输入、语音识别、手势缩放、触摸反馈、视觉交互等更加灵活沉浸的知识查询方式。第三,新型辞书条目内容强调动态生成、按需展现,突破传统辞书条目内容固定、一次展开的呈现方式。条目内容可根据用户需求和使用场景,精准匹配使用意图后完成个性化推送,以满足跨人群、多场景的语言应用服务需求,更好回应人民群众日益增长的语言文化需求。
数智时代为权威语文辞书的创新发展带来了前所未有的机遇。我们要坚持守正创新,在守与变、古与今、体与用之间,正确处理文化传承与创新发展的关系。要用数字化、智能化手段,加速辞书现代化转型,提升服务能力,满足人民群众日益增长的语言文化需求,打造与时俱进、无愧于时代和人民的优秀辞书产品。
(本文系国家社科基金重大项目“辞书编纂用大型多功能语料库建设与研究”(23&ZD314)阶段性成果)
(作者系中国社会科学院语言学重点实验室、辞书编纂研究中心助理研究员)