首页 >> 图书情报学
图情领域机构知识库可聚合性分析
2017年06月19日 10:39 来源:《图书情报知识》 作者:曹树金 古婷骅 马翠嫦 字号

内容摘要:图书情报领域的机构知识库的资源能够在一定程度上满足信息聚合需求,但仍存在中文资源可聚合数量较为缺乏等问题,而版权许可问题是目前资源聚合的最大障碍。本文最后提出了机构知识库的聚合策略。

关键词:图情领域;机构知识库;信息聚合;开放获取;版权;可聚合性

作者简介:

  作者简介:曹树金,男,中山大学资讯管理学院博士生导师,教授,研究方向:信息组织,信息检索,网络信息资源管理;古婷骅,中山大学资讯管理学院博士生,研究方向:网络信息资源开发与利用,用户行为,知识产权,E-mail:guthmail@126.com。广州 510006;马翠嫦,博士,中山大学图书馆副研究馆员,研究方向:信息行为,用户认知,数字图书馆。广州 510275

  内容提要:开放获取的机构知识库资源是网络信息资源聚合对象的一个重要组成部分,目前机构知识库资源的可聚合性直接影响聚合实现的效率和质量,本文在论证可聚合性分析框架的基础上,调查OpenDOAR中图书情报领域开放存取资源的分布情况、相关政策以及数据开放方式。调查结果显示,图书情报领域的机构知识库的资源能够在一定程度上满足信息聚合需求,但仍存在中文资源可聚合数量较为缺乏等问题,而版权许可问题是目前资源聚合的最大障碍。本文最后提出了机构知识库的聚合策略。

  关 键 词:图情领域 机构知识库 信息聚合 开放获取 版权 可聚合性

  标题注释:本文系国家社科基金重大项目“基于特定领域的网络资源知识组织与导航机制研究”(12&ZD222)、国家社科基金青年项目“语义和情景关联的网络资源聚合单元分类体系构建与评估研究”(14CTQ015)、广东省哲学社科规划项目“网络资源聚合单元分类体系与本体构建应用研究”(GD13CTS04)的成果之一。

  [中图分类号]G250.73 [文献标识码]A [文章编号]1003-2797(2016)06-0095-12

  1 引言

  目前,国内外对机构知识库(Institutional Repository,下文简称IR)的理论研究在IR的定义、特点、功能、作用等方面有较为集中及深入的讨论[1-2],对于实践方面的关注点集中在版权问题、资源可持续利用问题、质量控制问题、提高用户参与度问题等。随着知识服务技术和方法的发展,国内外对网络学术资源的深度聚合研究日益增多,网络学术资源来源广泛,内容多样且类型丰富,但同时也存在质量参差不齐、资源异构、版权风险不确定等影响资源可聚合性的问题。作为免费开放的网络学术资源中重要的一类,机构知识库中的资源具有开放性、特定性、永久性、累积性、互操作性等特征[3],基于这些特征,机构知识库中存储的信息资源无疑是信息聚合的首选对象。

  截止到2016年2月20日,OpenDOAR共收录世界范围内机构知识库共1766个,其中,包含图情学科(Library and Information Science,LIS)领域的机构知识库数量为121个,占所有学科的6.8%。在OpenDOAR的28个学科分类中排17位,处于中间位置。根据2008年的统计数据,当时共收录150个机构知识库,图书情报领域机构知识库13个,占所有机构知识库数量的8%[4]。有学者在2011年对OpenDOAR的所有机构知识库进行统计分析发现,2006年是机构知识库快速增长的阶段[5],图情领域机构知识库以2009年为分割点,机构知识库从起步期进入高速发展期。机构知识库的高速发展是各领域学者所喜闻乐见的一个现象,然而,如何将机构知识库的资源充分利用,也是机构知识库发展过程中备受关注的问题之一。有学者指出现有OA资源整合平台的不足之处,包括可检的OA资源种类不能面向非文本型资源,OAI元数据收割协议的局限性,检索功能不完善等[6],这些不足,作者认为可以通过搜索引擎来解决。同时,聚合技术的发展能够在此基础上使得知识有效关联、交互和聚类,通过信息聚合,实现有序内容的上传、布局、组织、展示和使用[7]。实现机构知识库的资源聚合,可以弥补机构知识库组织模式中学科和专业设置缺少一致性的问题[8],以学科知识点为网络的知识组织方式更利于用户使用。其次,可以避免由多软件形式而导致的无法实现统一标准、统一平台,无法实现知识点网络的共享问题。最后,聚合更可以通过可视化的知识链展示技术,在版权许可范围内的知识层面上开放获取,突破以往由于版权限制无法获取全文,导致无法辨别信息内容的情况,便于研究人员更好的判断、定位所需资源。那么,当前机构知识库所收录的资源、资源组织方式、复用政策能否符合信息聚合的需求?如果需要对机构知识库中的资源进行信息聚合,在现有的资源、组织方式和政策框架下,应当采取什么策略?这正是本研究希望探讨和回答的问题。

  2 文献综述

  与聚合相关的机构知识库研究,主要包括IR资源分布与组织研究、IR利用研究、IR涉及的版权问题研究以及资源整合研究。

  2.1 机构知识库资源分布与组织研究

  当前针对图情领域机构知识库资源分布的研究主要基于定量研究方法。根据不同的研究目的,对特定的机构知识库或基于开放获取名录进行统计分析。研究的关注点集中在:机构知识库建设者的国别分布,了解在特定方面/特定领域机构知识库在哪些国家或地区更受重视[9];分析机构知识库的发展情况,了解特定方面机构知识库的发展历史与概况[10]。对资源类型分布研究主要针对正式出版物,但机构知识库中还存在大量教学科研资源,对这部分资源的有效收集、管理以及再利用仍然有待进一步的深入研究与讨论。

  聚合系统的理论和实践研究还在发展当中,而在学科信息门户的研究上已经有一定的成果。学科信息门户同样以收集、整理及提供网络学术资源,以便为教学科研人员提供高效便捷的信息服务为目的,这方面的研究成果对聚合系统的信息组织模式研究具有一定的参考意义。当前专门针对机构知识库的资源分类及组织研究不多,散见于对网络信息资源的分类研究中,研究重点在跨语种本体构建与协调[11-14],基于关联数据的跨语种语义网建设[15-18],跨语种资源和知识组织系统互操作[19-23]等。

  2.2 机构知识库资源的利用及版权研究

  机构知识库资源利用研究主要从用户需求的角度切入,探讨机构知识库的认知、参与[24]以及可用性评价[25-27]等方面。国内对于机构知识库的接受程度和利用情况也进行了调查[28-29],与国外的调查结果较为一致,对开放获取资源有使用意愿[30-31],但相对于商业机构建设的文档分享网站而言,科研人员的接受程度和使用状况不太理想。

  版权方面的研究集中在建设机构知识库软件的版权问题以及所收录内容资源的版权问题。机构知识库软件的版权方面,按照软件版权所有人可分为开源软件、商业软件以及公有软件(即版权已经过期或版权所有人放弃版权的软件),目前绝大部分机构知识库使用开源软件构建系统平台,降低运营成本以及有效规避知识产权的风险,因此在软件使用方面不容易引起纠纷。针对资源的版权,研究者们多从以下几个角度进行深入分析,根据不同的版权所有人进行分类讨论[32],按照期刊论文[33]、学位论文[34]、研究报告等不同形式的内容资源进行分类讨论。

分享到: 0 转载请注明来源:中国社会科学网 (责编:毕雁)
696 64.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
wxgg3.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们