首页 >> 图书情报学 >> 目录研究
领域导向的数字图书馆移动视觉搜索引擎建设研究
2017年06月26日 10:12 来源:《图书与情报》 作者:张兴旺 郑聪 字号
关键词:移动视觉搜索;数字图书馆;搜索引擎;领域导向

内容摘要:视觉大数据资源作为大数据的重要组成部分,其价值产生机理与转换规律具有高度的领域依赖性。

关键词:移动视觉搜索;数字图书馆;搜索引擎;领域导向

作者简介:

  作者简介:张兴旺(1982- ),男,桂林理工大学图书馆副研究馆员。桂林 541004;中山大学资讯管理学院博士研究生。广州 510006;研究方向:数字图书馆;郑聪(1988- ),男,桂林理工大学图书馆助理馆员,研究方向:信息服务。桂林 541004

  内容提要:视觉大数据资源作为大数据的重要组成部分,其价值产生机理与转换规律具有高度的领域依赖性。文章从数字图书馆移动视觉搜索引擎的领域依赖性分析入手,运用模块化设计思想对其业务流程进行了分析,在此基础上,提出了一种领域导向的、自适应的、可演化的数字图书馆移动视觉搜索引擎。最后,分析了该引擎的各功能模块,并对该引擎的自适应性、可演化等特征进行了探讨。

  关 键 词:移动视觉搜索 数字图书馆 搜索引擎 领域导向

  标题注释:本文系教育部人文社科基金“基于大数据的数字图书馆移动视觉搜索机制及其应用模式研究”(项目编号:15YJC870012),广西哲社基金“基于大数据的移动视觉对象知识库建设及标准化问题研究”(项目编号:15BTQ003),广西高等学校高水平创新团队及卓越学者计划项目(项目编号:桂教人2014[49]号)的研究成果之一,“基于大数据的数字图书馆移动视觉搜索机制及其应用模式研究”系列论文之一。

  中图分类号:G254.9 文献标识码:A

  1 引言

  随着互联网和信息检索技术的飞速发展,文本、图像和视频等不同类型的视觉资源及关联信息(如评论、描述、用户行为等信息)更加紧密的融合起来,以一种全新的形式来描述视觉资源之间的语义、主题和事件,并逐渐成为各类数字图书馆重要的信息载体及各种信息搜索引擎、系统与平台的重点处理对象。据IDC于2012年发布的报告显示预计到2020年,全球数据总量将超过40ZB(约4万亿GB),其中75%来自于互联网环境,数据类型主要是文本、图像与音视频等。面对如此庞大的视觉资源,如何对其进行有效的组织、描述、表达与处理,使用户能够便捷地找到最有价值的信息,自然就成为信息检索、数字图书馆等领域亟待解决的前沿问题。

  视觉资源的价值发现需求与语义检索、移动互联网技术的跨界融合有效推动了移动视觉搜索理论、模型与技术的发展。而移动智能终端、移动互联网及移动应用等软硬件条件的迅速发展,也为视觉搜索从PC端向移动终端发展提供了软硬件支持[1]。同时,各类相关技术趋于成熟,也为数字图书馆移动视觉搜索提供了全方位的技术支持。一是FRBR、RDA与BIBFRAME等可为视觉大数据资源语义本体概念模型的构建提供支持;二是链接开放数据(Linking Open Data,LOD)、关联数据(Linking Data)、资源描述框架(Resource Description Framework,RDF)等可为视觉大数据资源的组织、描述与表达提供支持:三是OpenCV、RAVL、ARToolKitPlus与CImg等开源计算机视觉库可为视觉资源的分析与处理提供支持;四是Web 3.0、移动互联网、语义检索与JAVA等可为移动视觉搜索平台建设提供支持;五是现有的Google知识图谱、百度识图、爱奇艺大脑与淘宝拍立淘等成功案例可提供经验支持。而本文的研究目的是结合已有相关理论、技术与应用成果,提出一种面向视觉大数据资源的自适应的、可演化的数字图书馆移动视觉搜索引擎。

  2 数字图书馆移动视觉搜索的领域依赖性与业务分析

  2.1 数字图书馆移动视觉搜索的领域依赖性分析

  2015年9月,国务院印发了《促进大数据发展行动纲要》,目的是要提升“领域数据资源的获取和利用能力”、实现“领域信息资源的汇聚整合和关联应用”,“推动跨领域、跨行业的数据融合和协同创新”[3]。2016年7月,国家自科基金委发布的重大研究计划《大数据驱动的管理与决策研究》提出,“大数据价值的产生机理和转换规律具有高度的应用领域依赖性”[4]。2015年7月,国家社科规划办将“面向大数据的数字图书馆移动视觉搜索机制及其应用模式研究”列入重大招标课题[5]。视觉大数据资源作为大数据重要组成部分,其价值产生机理与转换规律也必然具有高度的应用领域依赖性。

  移动视觉搜索概念源于2009年12月斯坦福大学主办的第一届Mobile Visual Search研讨会,在过去的七年里,其理论与应用研究尽管有了较大发展,但受限于移动互联网环境和技术、视觉处理技术等影响,现有相关研究还具有一定局限性,已有研究重点还是集中在视觉资源处理技术[6-7]、模式探讨[8-9]、机制建设[10]、架构分析[11]与标准化问题分析[12]等方面,而忽略了数字图书馆本身的领域特性分析、移动视觉搜索引擎研究与视觉知识库构建分析等内容的研究。与大数据、互联网环境中信息资源的泛在化、非结构化或半结构化存在形式不同,各类数字图书馆均有着较强的专业性、领域性和可拓展性,且其在视觉大数据资源的语义组织、描述与表达形式等方面有着先天优势,能够较好地满足视觉大数据资源的领域依赖性处理需求。

  此外,数字图书馆移动视觉搜索引擎需要处理的是各种各样的视觉大数据资源。而视觉大数据资源来源于互联网、大数据环境,视觉资源彼此之间存在着较大的语义鸿沟(见图1)。其中,视觉资源的底层视觉特征大多处于高维空间,难以分析、处理、存储和计算,且高维向量还存在着稀疏性强、噪声高等问题,而这些问题处理方法极大地依赖于其所处领域。视觉资源高层语义信息主要包括其所处的视觉场景语义(如商场、街道、楼栋等)、视觉主体行为语义(如演唱、阅读、行走等)和视觉主体情感语义(如高兴、悲伤、安静等),而这些高层语义信息的分析与处理难度更大,且涉及的知识领域更多,领域依赖性更强。因此,目前已有研究大部分是在选择特定应用领域之后,结合其领域的专业特征,对视觉资源的中层语义建模来进行研究,通过构建视觉资源底层视觉特征到中层语义模型之间的映射,将底层高维度的视觉特征映射到中层低维度的语义空间中去,进而缓解视觉资源的底层视觉特征与中层语义之间的语义鸿沟。

  

图1 领域导向的数字图书馆视觉资源表达层次模型

  2.2 数字图书馆移动视觉搜索的业务流程

  文献[1][2][13]曾对移动视觉搜索给出过明确定义,即:移动视觉搜索是通过移动智能终端获取现实世界的图像或视频作为检索对象,通过移动互联网去搜索其关联信息的一种信息获取方式。并对其相关业务流程、服务模式及基本特征等问题进行过详细描述。笔者也曾对现有商业型视觉搜索产品进行过调研,根据现有商业型视觉搜索产品使用情况来看,部分产品的相关业务流程描述过于技术化,而模块化、领域化思想体现的不是很明显,而模块化、领域化的业务流程描述方法有助于体现数字图书馆移动视觉搜索引擎的可拓展性、自适应性、可演化性和开放性。目前已发布的Google知识图谱、百度识图、淘宝拍立淘等商业型视觉搜索产品,其相应体系架构、业务流程的表达与描述都具备了较强的模块化、专业化特征,而对应的应用与实践也具有较强的领域依赖性。

作者简介

姓名:张兴旺 郑聪 工作单位:

转载请注明来源:中国社会科学网 (责编:毕雁)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们