首页 >> 图书情报学 >> 目录研究
基于深度学习的学术搜索引擎
2018年06月08日 10:09 来源:《情报杂志》 作者:谢智敏 郭倩玲 字号
关键词:学术搜索引擎;Semantic;Scholar;深度学习;人工智能

内容摘要:Semantic Scholar通过机器学习可以使系统理解不同引用之间的影响力差异,提出了基于引用内容分析的学术影响力评价指标,但在信息来源、学科范围、检索功能和个性化服务功能方面还有待进一步完善。最后提出今后学术搜索引擎的发展展望。

关键词:学术搜索引擎;Semantic;Scholar;深度学习;人工智能

作者简介:

  作者简介:谢智敏(1979- ),ORCID:0000-0002-4236-3542,男,硕士,北京化工大学图书馆馆员,研究方向:信息素养教育,信息服务,用户行为研究,电子资源建设;郭倩玲(1971- ),通信作者,ORCID:0000-0001-5947-6108,女,博士,北京化工大学图书馆副研究馆员,研究方向:信息素养教育,信息服务,用户服务,科技情报分析。北京 100029

  内容提要:[目的/意义]AlphaGo战胜李世石后,人工智能的研究与发展备受关注。在此之前不久,基于深度学习的Semantic Scholar免费学术搜索引擎的问世,也为科研工作者们搜索和筛选学术文献资源带来了新的体验。[方法/过程]在介绍人工智能、机器学习和深度学习之间关系的基础上,介绍了Semantic Scholar的检索功能,重点就该引擎基于系统在理解文献内容基础上的学术影响力评价功能作了分析,并将Semantic Scholar与现行主流学术搜索引擎Google Scholar、Microsoft Academic、必应学术和百度学术进行比较研究。[结果/结论]Semantic Scholar通过机器学习可以使系统理解不同引用之间的影响力差异,提出了基于引用内容分析的学术影响力评价指标,但在信息来源、学科范围、检索功能和个性化服务功能方面还有待进一步完善。最后提出今后学术搜索引擎的发展展望。

  关 键 词:学术搜索引擎 Semantic Scholar 深度学习 人工智能 引用内容 学术影响力评价

  中图分类号G250 文献标识码A 文章编号1002-1965(2017)08-0175-08

  0 引言

  众所周知,单纯以被引次数来衡量和评价学术影响力的SCI模式,近年来已经遭遇学术界越来越大的质疑和挑战。一篇文章是在综述阶段被引用,还是在方法论阶段被引用,其学术影响力的差距是不言而喻的。传统的学术搜索引擎无法甄别论文被引的原因,但是人工智能的最新进展已经使得这一工作成为可能。

  人工智能几经沉浮,随着图形处理器(Graphics Processing Unit,GPU)的广泛应用,使得并行计算变得更快、更便宜、更有效,也使得人工智能近几年在图像分类、语音识别、人脸识别等方面有了长足的进步。2016年Google子公司Deepmind开发的围棋程序AlphaGo战胜李世石之后,人工智能的研究与发展更是备受关注。

  另一方面,随着计算机和信息技术的高速发展,各种传统的学术文献信息资源已经基本实现数字化,并且以惊人的速度增长着,每年全球发表的论文达100多万篇。面对海量的数字化学术文献信息,免费的学术搜索引擎如Google Scholar、PubMed、百度学术等为广大科研工作者搜索学术文献提供了方便,但这些基于数据库技术的传统学术搜索引擎无法像人类一样理解文献的内容,随着文献数量的增加,若想快速而准确地定位需要的学术文献信息仍然变得越来越困难。

  在这样的大背景下,美国艾伦人工智能研究所(Allen Institute for Artificial Intelligence,简称AI2)推出了基于深度学习的Semantic Scholar学术搜索引擎。Semantic Scholar的问世受到了科研工作者们的高度重视,Nature[1]和Science[2]相继发布了Semantic Scholar问世的新闻。Semantic Scholar免费学术搜索引擎的面世,将会给科研人员的学术文献信息检索工作提供更多帮助,并大大提升工作效率。Semantic Scholar不再仅仅限于为用户提供文章检索的简单功能,而是将深度学习技术用在信息筛选上,基于深度学习的检索系统能同时理解查询者的需求和文献的意思,这将为科研工作者省去更多筛选的工作。

  1 人工智能发展概况

  人工智能的概念诞生已有60年历史,对人工智能、机器学习与深度学习之间的关系最形象化的描述是同心圆模型[3],见图1。由图1可以看出,人工智能是最早出现的,即最大、最外侧的圆;其次是机器学习,位于人工智能的内侧;最内侧就是深度学习,当今人工智能大爆炸的核心驱动。

  1.1 人工智能 人工智能(Artificial Intelligence,AI)是1956年在达特茅斯会议(Dartmouth Conferences)上最先提出的概念,到目前为止,并没有确切的、统一的定义。通常认为人工智能是研究如何使机器模拟人类的思维过程、学习、思考、推理和规划等行为,并利用其解决问题的一门综合性学科[4]。人类最理想的人工智能,是令机器拥有与人类同样本质特性的智慧,即所谓“强人工智能”,而当前实现的人工智能只能称为“弱人工智能”,实现当前人工智能的方法,即为同心圆的下一层——机器学习。

  

图1 人工智能、机器学习与深度学习

作者简介

姓名:谢智敏 郭倩玲 工作单位:

转载请注明来源:中国社会科学网 (责编:毕雁)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们