本报记者 刘雨微
以谷歌学术搜索和Web of Science等为代表的学术在线检索,正深刻改变着学术研究格局。2004年11月,谷歌学术搜索正式上线,为全球研究者开辟了便捷的学术知识获取新途径。彼时,互联网技术正深刻重塑学术研究生态。二十年过去了,谷歌学术搜索究竟是实现了初衷,还是在带来便利的同时也引发了新问题?近日,希腊比雷埃夫斯大学经济系助理教授基里亚科斯·德里瓦斯(Kyriakos Drivas)在英国伦敦政治经济学院博客官网发文,探讨学术知识的数字可得性对科学传播的影响,分析谷歌学术搜索是否改变了跨领域文献引用模式,为相关研究提供了新视角。
互联网时代学术研究态势变化
德里瓦斯表示,互联网的兴起深刻改变了学术研究的格局,学术论文数量呈爆发式增长。OpenAlex数据显示,学术著作数量从1984年的140万篇,增长到2004年的500万篇,再到2024年的890万篇,在短短几十年间实现了惊人累积。在此背景下,谷歌学术搜索、PubMed、Web of Science、Scopus和OpenAlex等在线检索平台应运而生。这些平台作为贯穿整个科学领域的重要技术,极大地降低了研究人员的搜索成本和信息不对称性,为研究者提供了全面且高效的学术文献导航工具。谷歌在其使命宣言中明确表示致力于“整合全球信息,使人人皆可访问并有用”(to organise the world’s information and make it universally accessible and useful)。然而,这些在线搜索平台究竟是阻碍还是促进了远距离知识的重组,仍是一个亟待解答的问题。
早期研究者曾担忧在线学术资源的可获取性会影响学术研究质量。2008年,美国芝加哥大学社会学系教授詹姆斯·埃文斯(James Evans)在《科学》期刊发表文章《电子出版与科学和学术研究的狭窄化》(Electronic Publication and the Narrowing of Science and Scholarship)。他分析了一个包含3400万篇文章的数据库,涵盖1945年至2005年的引用信息以及1998年至2005年的在线可获取性,发现随着更多期刊文章上线,引用的文章更趋向于最新发表的,引用的期刊和文章数量减少,且引用更集中于少数期刊和文章。
德里瓦斯认为,科研人员如果仅在自己熟悉的领域内搜索文献,可能会导致早期论文中的“旧”知识被忽视,进而损害跨学科研究的发展。美国波士顿大学管理信息系统系助理教授马歇尔W.范·埃尔斯泰恩(Marshall W. Van Alstyne)和斯坦福大学以人为本人工智能研究所教授埃里克·布林约尔松(Erik Brynjolfsson)表示,互联网通过科学专业领域形成的全球性合作,可能会减少本地跨学科交流,这种现象被他们称为“网络空间的巴尔干化”。
在线检索平台不是科学“狭窄化”的成因
为了探究谷歌学术搜索对学术研究的真正影响,德里瓦斯借助OpenAlex数据集,开展了一项针对性研究。他聚焦于2004年谷歌学术搜索上线后,1950年至1969年间发表的期刊论文——这些较早期且较难被发现的论文的引用率变化情况。为确保研究结果的可靠性,他将这些早期论文在2004年之前的引用模式与新发表的论文进行了匹配分析。通常,论文的引用量呈倒U型关系:发表初期引用量较少,随后达到峰值,之后逐渐下降。为进一步检验结果是否对引用滞后性敏感,德里瓦斯又分别对1980年至1984年和1985年至1989年发表的两组论文进行了匹配分析。这些论文相对较新且更容易被发现。
德里瓦斯认为,谷歌学术搜索并未像学者所担忧的那样,偏重传播“新”知识而埋没“旧”知识。他的数值分析发现,早期论文在科学文献中的代表性与其在科学领域的整体表现相当,这与此前研究结果一致。进一步分析表明,早期论文的引用量出现了无法用此前模式解释的上升,这表明谷歌学术搜索可能是这一变化的原因。更重要的是,这些早期论文被引用的范围超出了其所属的广泛领域,这表明此前学术界关于论文的在线可获取性可能导致科研范围缩小,即科学的“狭窄化”的担忧并未成为现实。
近年来,学术界围绕研究人员是否越来越聚焦于特定方向、产出同质化成果展开了激烈讨论。例如,2023年美国明尼苏达大学卡尔森管理学院助理教授罗素·芬克(Russell Funk)等人在《自然》杂志发文指出,论文和专利的颠覆性随时间降低,这一趋势在各领域普遍存在。然而,芬克等人的结论也受到质疑,部分学者认为其衡量标准和研究方法存在缺陷。
德里瓦斯认为,无论这场辩论的结果如何,在线检索平台都不太可能是文献引用行为同质化的根源。他对在线检索平台持积极态度,认为如果得到合理开发和使用,这些平台将发挥巨大作用,甚至在用户不易察觉的方面也能带来益处。例如,许多年轻研究人员可能不知道,过去很长一段时间内,文献引用只归功于第一作者。正如文献计量学和科学计量学奠基人尤金·加菲尔德(Eugene Garfield)所说:“要是你在引文索引里查某个科学家被引用的作品,你会发现里面只有他被列为第一作者的那些论文……很明显,这个特点会影响一个人的引用率准确性。”
在德里瓦斯看来,这种现象自然会激励科研人员争取成为第一作者,而引用认可问题也成为争议焦点。在此背景下,Web of Science的推出在一定程度上促进了科研团队内部的公平性,降低了作者顺序的重要性。
自上线以来,谷歌学术搜索等在线检索平台在促进学术知识传播和提高研究效率方面发挥了积极作用。然而,这并不意味着这些平台以及科研的数字化和索引化没有负面影响。在线检索平台的一个潜在问题是搜索结果的覆盖范围和排名缺乏透明度,这可能降低研究人员对平台的信任。此外,尽管习惯性使用这些平台可以提高效率,但如果平台本身存在缺陷,也可能适得其反。如何在提升用户体验和保障学术研究的深度与广度之间找到更好的平衡,仍是各大在线检索平台需要不断探索的方向。这不仅是技术的创新,更是对学术研究生态的深刻回应,关乎全球学术发展的未来。