首页 >> 社会学
“计算”的边界:互联网大数据与社会研究
2018年11月27日 09:11 来源:《中南大学学报:社会科学版》 作者:郝龙 字号
关键词:互联网;群体;计算;分析;网络;社会研究;研究方法;客观性;数据生产;人为干扰

内容摘要:内容提要:互联网大数据计算,是当前社会研究方法创新的主要方向之一。部分纯数据驱动型学者认为,大数据独立于研究之外生成,不仅能记录下人们的真实态度与自然行为信息,又可以摆脱研究者与研究本身的干扰,由此形成了“总体性”“真实—自然性”与“客观性”三大认识假定。认清互联网大数据的可“计算”边界,对于推动数据计算在社会研究中的应用有着重要的理论与方法意义。据第41次“中国互联网络发展状况统计报告”显示, 2017年中国网民规模达到7.72亿,而按照当年总人口数计算,中国互联网普及率只有55.8%,仍有近一半的中国人口未能成为互联网大数据的生产主体。

关键词:互联网;群体;计算;分析;网络;社会研究;研究方法;客观性;数据生产;人为干扰

作者简介:

  内容提要:互联网大数据计算,是当前社会研究方法创新的主要方向之一。部分纯数据驱动型学者认为,大数据独立于研究之外生成,不仅能记录下人们的真实态度与自然行为信息,又可以摆脱研究者与研究本身的干扰,由此形成了“总体性”“真实—自然性”与“客观性”三大认识假定。然而,无论是由数字鸿沟造就的年龄与阶层边界和由差异化生产划定的群体与主题边界,还是由数据操纵和数据引导带来的虚假(非真实)与偏态(非自然)状况,以及潜藏在整个数据生产—挖掘—分析过程中的人为干扰,都证明上述假定在很多情况下并不成立。认清互联网大数据的可“计算”边界,对于推动数据计算在社会研究中的应用有着重要的理论与方法意义。

  关键词:互联网 大数据 计算范式 数据缺失 数据偏态 数据操纵

  作者简介:郝龙,武汉大学社会学系博士研究生,主要研究方向:数字社会学与计算社会学。

  标题注释:国家社科基金重大项目“大数据时代计算社会科学的产生、现状与发展前景研究”(16ZDA086)。

  社会学的量化研究以数据资料为基础,大数据时代的到来,使运用海量数据和新的数据处理技术,对人类行为、群体互动乃至社会复杂适应系统进行研究成为可能。可用于社会研究的大数据,依其生成方式大体可分为三类:第一类是基于人机互动在互联网和移动互联网平台上生成采集的互联网大数据①,包括社交关系数据、网络文本数据、电子踪迹数据等;第二类是通过各种传感器采集而来的物联网大数据,手机位置信息是其典型类型;第三类则是通过数字化与数据化手段由既有信息资料转制而成的大数据,例如谷歌图书语料库(Google Books Corpus)[1]。在三类数据中,互联网大数据由于承载着大规模、长时段、连续关系性和意义性信息,被认为将赋予社会学“改变我们对生活、组织和社会的理解”的潜力[2]。

  单从名称上看,“大数据”好像是在强调与传统量化数据相比所具有的更大个案数量或信息规模。然而实际上,两种数据无论是在数据性质还是生产逻辑上都存在着质的差异:传统计量方法分析的是数值型数据(numerical data),这些数据是出于特定研究目的而运用实验、问卷调查等方法有计划地观测的结果,即数据生产本身就构成了研究的一项重要组成部分。新型计算方法所处理的则是计算机代码型数据(code data)——“作为数据的可解释代码和作为代码的数据”[3],这些数据独立于社会研究之外。数据生产的独立性,也决定了其在社会研究中的边界。在计算范式下,数据分析的焦点不再是能测量到什么,而是“已经生产出什么”;不再是“能否有效且稳定地测量”,而是“是否真实且准确地生产”。[4]在由“可观测性”议题转向“可获得性”议题的过程中,围绕着大数据计算形成了一系列认识假定,其中对社会研究最为重要的有“总体性”“真实—自然性”“客观性”三大假定。“总体性”假定指大数据时代的到来,开启了“样本=总体”的全数据模式,数据代表性问题将不复存在;“真实—自然性”假定指互联网上记录的是人们行为互动的真实踪迹和“自然状态”下的表达;“客观性”假定指基于大数据的研究可以避免研究者个人因素的影响,能够获得传统研究方法无法企及的、带有真理性、客观性和准确性的见解。然而,将大数据运用于社会研究,就会发现实际情况并没有预想的那么乐观。

作者简介

姓名:郝龙 工作单位:

转载请注明来源:中国社会科学网 (责编:于翠杰)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们