中国社会科学报广州讯 (记者李永杰)7月30日,粤语语料库建设与大模型评测重点实验室(以下简称“重点实验室”)与羊城晚报报业集团“岭南文化大模型实验室”在广州签署战略合作协议。双方将携手共建粤语文化语料库,启动多模态粤语语料数据产品建设与运营,联合打造国内首个粤语智能化应用生态。
据了解,重点实验室致力于将深厚的岭南文化精神积淀与先进的自然语言处理技术相结合,建设体现岭南文化特色且人工智能友好的多用途大规模粤语语料库,以此连接全球粤语AI生态系统,促进岭南文化在人工智能技术的赋能下传承与发展。作为国内首个文化领域的多模态推理大模型,岭南文化大模型自2025年3月发布以来,已连续发布14B、32B两个参数版本模型,在岭南文化知识问答、多模态推理、文旅规划、乡村振兴等多个领域展现出卓越能力。
“我们要让AI不仅会说粤语,更要说得地道、说得有文化。”广州大学网络空间安全学院教授、重点实验室主任齐佳音表示,此次合作旨在为粤语文化数字化保护与活化利用开辟新路径。未来3年,双方将共同致力于构建粤港澳大湾区语言智能新生态,探索语料库建设的社会化工程、区块链确权等创新机制,让技术真正服务于文化传承与社会发展,为中国方言保护贡献“广东智慧”。
据介绍,粤语语料库建设与大模型评测重点实验室由广州市社科联和广州大学联合共建,旨在通过“粤语+人工智能”的文化科技融合创新,推动粤语传承传播和发展。重点实验室由中国工程院院士、广州大学教授方滨兴,香港科技大学(广州)党委书记、国家语言服务与粤港澳大湾区语言研究中心主任屈哨兵担任双首席科学家。