当代社会学定量研究的宏观转向

2022-04-13 作者:陈云松 来源:《中国社会科学》2022年第3期

摘  要:社会学定量研究长期以来过度倚重基于个体样本的调查数据,在视野、方法和理论观照等方面逐渐形成“微观旨趣”,削弱了其对学科发展和社会治理的贡献能力。基于整体主义的宏观定量分析,在社会学中具有坚实的方法论基础、数据条件和多维度价值。从“微观旨趣”向“宏观观照”的转向,业已形成基于饱和数据的时空覆盖研究和基于大数据的“宏观定量社会学”两种模式。后者涵盖海量文本结构发现、网络复杂性研究、宏观假说检验和多层机制探索等具体研究取径。当代中国“宏观定量社会学”的发展走在这一转向的前列,对拓展学科疆域和构建中国特色社会学话语体系具有重要意义。

关键词:宏观定量社会学;微观旨趣;宏观观照;定量研究;大数据

作者陈云松,南京大学社会学系教授(南京210093)。

  

  数十年来,社会学定量研究一直处于方法革新和快速发展之中,在整个学科中的地位也越来越重要。但社会学定量分析的主导模式,却始终依赖于个体层面的调查数据和统计回归。这种分析模式的稳定性,为定量研究的科学积累奠定了扎实基础,但也促成了一种暗中的停滞:定量社会学的研究视野日渐锚定于个体微观层次,研究旨趣日渐集中于模型细微之处的打磨,并在不知不觉中失去了聚焦宏观现象、发现和检验宏观理论的问题意识。我们将这种当代社会学定量研究的困境称之为“微观旨趣”的路径依赖。随着时间的推移,这种路径依赖已开始逐渐削弱社会学定量研究在检验大理论和服务“国之大者”方面的能力。不过,计算社会科学的发展为摆脱这一陷阱提供了重要的时代条件。特别是,大数据的应运而生以及机器学习等计算方法的普及,初步催生了聚焦宏观理论和复杂社会现象的“宏观定量社会学”,在重拾“宏观观照”的过程中实现当代定量社会学的“宏观转向”。

  本文将首先从现状特征、历史渊源和当代危机等方面剖析“微观旨趣”在定量社会学研究中的渊薮与源流,然后从本体论、方法论、应用价值和实现条件等角度探讨基于整体主义的宏观社会研究何以可能。在此基础上,对新数据和新方法何以助推定量研究的宏观转向进行阐述和文献回顾,总结研究取径。最后,本文进一步梳理当代中国宏观定量社会学所呈现出的本土化自觉和多重使命担当。

   一、社会学定量研究的“微观旨趣”

  (一)微观旨趣的呈现

  社会学定量研究是否真正过度沉溺于“微观旨趣”?我们对中美两国社会学权威期刊约30年来的全部论文进行检视,并把样本是自然人或法人的研究定义为代表“微观旨趣”的“个体研究”,把以县、郡、市、州或国家等行政区划为样本的分析定义为代表“宏观观照”的“群体研究”。从1986年到2020年,《社会学研究》发表定量论文586篇,其中“群体研究”仅17篇(见图1a)。类似地,《美国社会学杂志》(AJS)和《美国社会学评论》(ASR)自1992年到2019年发表的1282篇定量论文中,“群体研究”也仅157篇(见图1b)。实际上,在整个社会学学科中,微观研究特别是微观理论从20世纪70年代起就开始大行其道。

  

  如果参照著名的“科尔曼之舟”(Coleman’s Boat)对社会学定量研究进行分类,那么按因变量Y和自变量X所在的层级,可把研究划分为(1)“宏观—微观”分析(X在群体层次,Y在个体层次);(2)“微观—微观”分析(X和Y都在个体层次);(3)“微观—宏观”跃迁分析(X在个体层次,Y在群体层次);(4)“宏观—宏观”分析(X和Y都在群体层次)。前两种层次的分析是传统定量研究的“微观旨趣”主导模式:对个体层次样本拟合单层或多层回归模型。第三种层次关注的实际是跃迁、涌现等复杂过程,可通过仿真建模的人工社会方式来进行。第四种,也即宏观层次的关联(回归)研究,发展则明显滞后。此外,宏观层面社会主体的复杂系统呈现、集体结果的潜在结构特征发现,也在社会学研究中屈指可数(见图2)。重要的是,这三种宏观研究的理论对象,既不同于社会哲学、现象学等具有形而上学色彩的理论,也不同于帕森斯结构功能主义的抽象宏大、无所不包的解释体系,同时也异于默顿“中层理论”中诠释日常生活细节或微观实证机制分析。这种宏观社会分析,在理论生成三部曲(经验研究、中层理论、一般理论)中也毫无疑问处于中层理论位置。只是在社会学实践中,理论和质性研究对中层理论的聚焦,要比定量研究多得多。而一般理论则就是前文提及的包罗一切、自成体系的系统理论学说,也即默顿所谓的“大一统理论”(unified theory)或者我们常说的“大理论”。

  

  “微观旨趣”的个体研究和“宏观观照”的群体研究差异有三:

  (1)数据对象。个体研究聚焦自然人或家庭、厂商等,使用个体属性数据;群体研究则聚焦区域或集体,以其个体平均或群体指标数据来分析整个社会系统的行为。例如,检验假设A(朋友数量是否有利于个人求职)是典型的个体研究;检验假设B(城市的社会组织发展能否提升就业率)是典型的群体研究。(2)理论对象。个体行动或过程的微观理论、行动理论是个体研究的检验对象。而宏观理论特别是治理理论,则往往是群体研究的检验对象。例如,林南的社会资源理论是典型的个体微观理论,帕特南的社会资本理论则是典型的宏观社会理论。宏观理论往往以一个或多个微观理论为基础。例如帕特南的社会资本理论,是林南的社会资源理论、格兰诺维特的弱关系理论、边燕杰的强关系理论等微观理论的群体表征。(3)问题对象。个体研究要解决的是个体社会结果的最优化问题:个人的期望、行动、机会和结果之间的关系,以及宏观结构因素如何影响个体结果。群体研究则把个体的理性(或非理性)行动及限定因素作为既定前提,研究区域层面的治理结果的最优化过程,要解决的是社会福利的最大化。

  这三个对象的差异,归根结底是逻辑前提的不同。个体研究的逻辑前提是,社会由随机分布的个体形成总体,抽样样本中体现出的个体属性间的关联,可以推广到总体。在这个隐含前提下,社会由个体加总而成,而不是由空间、时间和行政结构所定义的单元组成。而群体研究的逻辑前提是,社会不是简单地由个体加总而成,而是由个体加总成的单元群体进一步组合而成。以群体为抽样样本或总体样本进行研究,可以更为准确地描摹人类社会的真实构成和治理结构。

  (二)微观旨趣的历史渊源

  1.方法论源流:方法论个体主义。方法论个体主义是一种还原到个体的理解社会过程的研究视角。也即,社会学解释的因果机制路径,必须建立在个体层面。马克斯·韦伯的新教伦理与资本主义研究就是典型:资本主义体制作为宏观社会结构的兴起,其底层要素乃是驱动个体行动的价值观念。激进的微观社会学倡导者甚至认为宏观概念只有转为微观事件的集聚才具有实证研究意义。和这种方法论针锋相对的是“方法论整体主义”。该视角认为社会事件固然由个体行动组成,但这从逻辑上无法直接推导出社会结果就必须从个体行动的基础去解释。因此,社会科学应该通过对集体组织、社会力量的研究来产生。如涂尔干对自杀的研究就是典型。

  2.学科发展烙印:时间框架的当代聚焦。韦伯、涂尔干、马克思、托克维尔等大家均曾赋予历史资料在社会学研究中的重要地位。但随着学科的建制化,古典社会学时代的人文主义历史旨趣逐渐褪色。与历史学、政治学和古典社会学相比,当代社会学研究在分析对象上明显地“厚今薄古”:连吉登斯也不得不承认,社会学家“较少关注对过去的再现,而更多地聚焦过往对现在的影响”。定量社会学的“当代聚焦”,和发展方兴未艾的量化历史、量化经济史和政治史研究形成了强烈对照。

  3.区群谬误警示:分析对象的层次固化。社会科学研究中的变量关系,在宏观群体层次和个体微观层次不一定相同。罗宾逊以美国的墨西哥移民为例进行了展示:在宏观层面,移民比例高的州文盲率较低;而在个体层面,文盲者的移民概率更大。就此塞尔文正式提出“区群谬误”(Ecological Fallacy)的概念,其批评直指涂尔干的经典自杀研究。 20世纪50年代开始,社会学家纷纷转向基于个体或家庭数据的微观研究。问题在于,对区群谬误的过度警惕甚至矫枉过正,使得20世纪末以来的定量研究被小心翼翼地固化在个体层次。

  4.数据可得性限制:宏观指标的稀缺。和经济学相比,社会学宏观数据获取较难。经济学家拥有从乡镇到国家等各级行政区划的宏观统计指标——如GDP、居民可支配收入、通货膨胀率、失业率以及城镇化率、土地空间指标、人口特征属性等数据。而社会学家关心的社会分层流动、社会网络乃至于幸福感、信任度等指标往往具有非显性的特征。群体层面特别是历时性数据资料的稀缺,在很大程度上导致定量社会学家对宏观研究“巧妇难为无米之炊”。

  (三)微观旨趣的当代学科危机

  微观旨趣的路径依赖,给定量社会学发展带来三个方面的危机。

  1.学科视野的窄化。第一,时间跨度不足。既然研究是基于个体调查的,那么数据的跨度必然受到调查时间和成本等限制。相比之下,田野访谈可以通过反复和深度交流积累起更大跨度的生命史、生活史资料,而理论思考本身可以究天人之际、通古今之变。第二,空间粒度过细。传统定量社会学的观测粒度是独立分布的个体,但社会运行和决策的主体,往往不是独立的个体。这导致了一个有趣的对比:质性研究者认为个案研究能够以其“事件化”特征激活社会,强调从个案中能展现宏观图景, 而定量研究者虽坐拥千百样本却对宏观图景不敢轻易置喙。

  2.研究方法的固化。传统定量研究的主导方法是调查问卷数据描述和拟合模型进行回归分析,但它不能解决如下研究问题:第一,重要社会指标的大时空描述。例如,美国建国以来的种族歧视,新中国成立以来公众幸福感、信任度、国家认同的世代演变。第二,非显性社会指标的准确测量。例如,性少数群体的人口比例、家庭暴力行为的发生比例等指标,虽事关社会治理,但因其敏感性导致问卷调查数据并不准确。第三,复杂系统形成和海量数据的特征发现。对海量数据特别是社会学关心的文本、图像,在大数据普及之前,学界普遍缺乏有效的解读工具。

  3.理论观照的矮化。第一,理论尺度局促。由于聚焦个体层次,定量社会分析所证实或证伪的假说理论,往往仅是个体生活中的社会过程,或宏观社会因果链条中的一个小小环节,而无法对宏观社会过程有总体性的探索。第二,学术旨趣纤巧。近十年来,社会学定量研究的旨趣愈显技术化和精致化,尽管在研究规范性、稳健性和因果性方面取得了重要进展,但也渐渐失去了原应属于社会学者的宏大想象力,以及致力服务“国之大者”的厚重情怀和问题意识。第三,研究根基悬浮。定量社会学的训练和实践,往往易使学者习惯于依托在手数据,对西方既有理论进行异地、异时和不同人群的拓展检验。这一倾向往往会形成数据和理论的时空脱节,助产一种“盆景式”的不接地气的研究。换言之,和理论研究滑向制造概念、质性研究滑向过度解读如出一辙,定量研究也颇易滑向闭门造车的内卷。

   二、宏观转向何以可能:基础、价值和条件

  (一)整体主义的方法论基础

  在当代社会学理论中,整体主义的本体论立场核心观点是:社会群体可以被视作一种“自在之物”的本体性存在,譬如社会、地域或阶层,具有主体性且在因果意义上是有效的。基于此,人类个体的行为法则和社会群体的过程法则有可能存在差异,故而两者之间无法还原化约或相互预测。这样,在社会学研究中有必要对分析层次加以区分:国际层面、国家层面、机构层面、个体层面等。尽管围绕社会群体的本体性存在长久争论(也即社会群体或结构是不是一种存在),但如果我们引入“随附性”(Supervenience)的概念,则会发现整体主义的优势不在于本体论而在于方法论。所谓“随附性”就是:如果个体属性必然体现了社会属性,那么我们就说社会层次属性“随附”在一系列个体层次属性之上。这样,个体属性相同的群体,其社会属性必然一致。但反过来未必如此,因为相同的社会属性可通过不同的方式来生成。当“随附”使得社会群体具有了非简单加总的个体属性,我们就可以回避本体论特别是因果主体争论,而是采用“方法论整体主义”的视野。也即,宏观层次的属性关联分析可成为社会学研究的应有之义。

   (二)宏观研究的多重价值

  基于整体主义的宏观定量研究,虽不必然构成对微观研究的替代,但能够从多角度形成重要补充。整体主义和宏观观照的学术价值,体现在四个方面:

  1.理论价值:宏观定量研究是“中层理论”研究的重要组成部分。默顿的“中层理论”中,既包括微观社会学研究,也包括宏观社会学研究。在默顿看来,位于宏观层面的社会组织之间的关联或结构特征,也应得到和微观社会研究一样的系统实证检验。既如此,我们可以断言,在以往的社会学定量研究中,对于“中层理论”的实证检验及发展是存在大量空白点的。而方法论整体主义和宏观观照,能推动新的研究实践来填补该空白,使得“中层理论”的实证研究维度更为完整。

  2.方法价值:宏观关联分析丰富了社会学因果推断的内涵。如果不以反事实因果推断为目标,那么在群体层面进行关联分析,并无逻辑缺陷。对任何一对X和Y进行个体群体两个层次的立体检验,更能剖析生态谬误问题,丰富因果推断内涵。此外,宏观定量研究除了以群体为样本进行回归关联分析之外,还能对宏观现象与结构进行深度呈现。这些研究与传统定量分析在认识论、问题领域、研究手段和统计规则方面大相径庭。

  3.治理价值:宏观社会研究直接服务于社会治理的决策。就服务社会治理、为决策提供依据而言,严格的因果推断并非必须。例如,如果A对B具有满足时序要求的稳定共变关系,那么通过政策干预改变A来影响B,就已经具有了治理价值。更重要的,社会治理往往是以行政区划为单位开展的,因此行政区划自然构成最便捷的宏观分析样本单元。对于中国这样的幅员辽阔、治理层级较多的大国来说,基于治理单元的宏观分析则更符合中国的地方治理实际。

  4.制度价值:宏观国际研究能够提供制度优势的实证检验。传统的定量社会学研究多关注单个国家、社会或地区,以其内部的个体样本为分析对象。而通过直接以国家、社会为样本进行回归分析,用面板模型等方法来探讨全球层面的国家经济社会结果与机制体制之间的关联,可提供全球制度竞争的新视野。例如,基于新冠肺炎疫情中的国家层面数据,我们可以分析不同严格程度的社会隔离政策对于社会公众情绪的影响如何,为隔离政策的选择和评价提供重要依据。

   (三)宏观定量研究的实现条件

  宏观层面定量研究的路径有二:一是通过局部宏观研究甚至宏观微观混合研究的累加来达到或接近宏观分析;二是直接在宏观层面对全部主体样本或单个复杂主体系统进行分析。

  1.饱和数据:以多时空数据重复检验来进行宏观实证。近年来,利用多来源数据的汇集,将众多局部地域的样本分析进行汇总的方法,被尝试用来检验宏大的社会理论。也即,以相似的分析方式对来自多个数据源的研究结果进行分析利用,以众多的以不同地域、不同方法但得出类似结论的局部性研究结果,来汇聚并验证宏观层面的假说。曾有学者将其比拟为“交响乐”式的社会科学研究,本文则称之为“饱和数据”分析方法。这类研究方法的逻辑简洁明快,且因汇集和使用多来源传统调查数据相对便捷。

  两本著名的经济学和社会学书籍,分别构成“宏观饱和数据”和“多层饱和数据”的典型:皮凯蒂的《21世纪资本论》和帕特南的《独自打保龄:美国社区的衰落与复兴》。前者采用了宏观层面的饱和数据方法,以国家为单位的数据覆盖近三个世纪、20多个社会。 后者则可视为采用了多层混合饱和数据的方法:在微观宏观两个层面尽可能多地找到互相支持的资料。这样,在无法获取全美各县郡州宏观数据的情况下,帕氏把局部宏观数据或微观样本数据及质性访谈数据,如马赛克一般在同一论证框架里组织起来。与使用单一调查数据的传统定量分析相比,饱和数据模式赋予“重复”以重要性:来自不同地域、对象、分析层次的数据、案例围绕同一个假说反复验证。当然,这一模式既需要可推广性的逻辑铺垫,也考验研究者的雄辩和说服艺术,甚至往往必须以著作而无法以论文的有限体量来呈现。

  2.大数据:从海量数据中建构指标以分析宏观社会。目前可供社科研究的大数据主要有六类:(1)数字化图书,如谷歌图书语料库(Google Ngram Viewer)、古腾堡数字图书馆项目(Project Gutenberg);(2)新闻数据库及云平台,如全球事件语言语调数据库(GDELT)、LexisNexis法务和新闻数据库,以及各类主流媒体的全文检索接口;(3)专业数据库,如中国知网(CNKI)、英文期刊数据库(Web of Science);(4)搜索引擎数据(谷歌趋势、百度指数、搜狗指数);(5)自媒体及视频、信息论坛网站(如微信、微博、B站、抖音);(6)专业平台,如国际影视数据库IMDb、百度地图POI数据、手机信令、信用卡数据。上述平台所提供的大数据,涵盖了时间趋势、空间差异、时空演化、网络结构和海量文本等维度。这些维度为宏观社会研究提供了大量时间序列数据、面板数据、复杂网络数据和文本对象,从数据条件的角度催生了新的宏观观照的研究类型。

  如果我们把前文所提及的聚焦个体属性关联的“个体研究”称为微观定量社会学,则与之相对的,我们把关注群体属性关联的“群体研究”,以及呈现群体结构和特征的量化研究,一并称之为“宏观定量社会学”。其最重要的特征,就是从海量大数据中提取出传统方法(如抽样调查、深度访谈等)无法获得或无法准确测量的关键性宏观指标,然后在群体层面运用时间序列模型、面板模型进行关联分析以进行宏观理论检验,或运用机器学习、仿真建模、社会网分析等计算社会方法进行宏观社会特征结构的展示与描述以提出或修正理论。从“微观旨趣”的个体研究,走向微观、宏观并进,通过重拾“宏观观照”来推动学科发展,是当代社会学定量研究的宏观转向。宏观定量社会学的兴起和发展,则是这一转向的产物。这一重要历史进程,既是社会学基于数据、算法、算力发展而必然形成的内生趋势,更是一种需要积极倡导的学科拓展和革新的路径。这是因为,无论是作为研究对象的大数据、复杂系统数据,还是作为方法的机器学习、时间序列、面板分析等工具,都和基于个体抽样调查数据的传统定量社会学大相径庭,亟待定量社会学界甚至整个社会学界的学习、适应和支持。更重要的,宏观定量社会学对学科发展和服务国家战略所能提供的价值,较之传统研究模式存在着重要优势。社会学定量研究的宏观转向,是研究的对象层次拓展,是分析的工具方法创新,是学科的理论观照升华,还是理论、数据和治理三元驱动的高度统一:它可以从理论观照出发寻求数据的描述验证,也可以从数据驱动出发形成理论的灵光闪现。在理论和数据的学科驱动之上,宏观定量社会学的发展更有着服务“国之大者”的治理驱动。

   三、转向之路:宏观定量社会学的当代取径

  当代社会学定量研究的宏观转向,具体取径为何?本文梳理出四个类型,分别在不同领域和层次解决了微观方法所不能解决的社会学研究问题。

   (一)基于海量文本的结构发现:社会文化特征的理论化

  传统文本分析,面对海量规模的文本常常束手无策。而文本是承载人类社会观点、价值和活动等情境信息的最重要载体,社会学的核心理论建构,如社会系统、集体行动、话语、场域、濡染等,都具有社会情境特征,也必然会潜藏在海量文本中。因此,学者尤其是文化社会学者主张使用各类文本大数据来发掘、测量数字与语义档案中的社会学意义。文化社会学权威刊物《诗学》(Poetics)早在2013年就专门刊发一期基于大数据和机器学习的论文。从文献积累来看,使用海量文本获取和解读庞大的非结构化数据以进行社会学分析,可以发现、推导文本中的社会现象与规律,并升华为核心理论建构。具体取径往往有二:

  1.潜在社会文化结构的识别与呈现。主要方法为借助机器学习挖掘文本中的语言学特征分类。前文提及《诗学》论文中,学者使用基于无监督机器学习的聚类分析也即主题发现模型(Topic Modeling),以揭示新闻出版物、学术期刊、小说诗歌、历史档案等海量文本中的主题、风格等认知框架和社会逻辑,以此提出新的社会理论。 有的研究还进一步结合经典统计方法,探讨性别、时空等显性社会结构如何塑造和影响隐性文化结构。例如,学者在对18—19世纪英语小说进行主题发现后,采用随机置换作者性别生成虚拟主题的半实验法,验证了作者性别和题材之间的关联。

  2.潜在社会文化规律的挖掘与诠释。主要方法为借助大数据可视化工具和指标描述,归纳发现文本中的特征和规律并形成社会文化理论。学者从大型书籍语料库、新闻数据库、自媒体中提取结构化的时间序列,然后以“远读”(Distant Reading,也即不深入具体事件、人物细节,而是从宏观角度把握海量资料里所潜藏的脉络与变迁)的方式来描述不同时间跨度的社会文化现象(诸如知名度、政治倾向、新闻态度、阶层话语)的时空演变,以此挖掘和展示传统方法未能发现的现象与规律,并结合相关文献加以诠释,形成新的知识领域。

   (二)基于网络数据的复杂性研究:复杂系统的社会学呈现

  社会过程中个体之间的互动,会通过网络的汇聚、涌现和跃迁等过程,在宏观层面呈现出复杂系统的特征。要描述和研究这样的复杂系统,并在此基础上进行理论化或提出政策建议,传统定量方法无能为力。大数据特别是网络互动数据的出现,为透视复杂现象提供了重要基础。当下社会学领域的复杂系统研究主要有两大维度:

  1.复杂网络的描述与测量。基于各类社会互动和关联的大数据平台(如社交媒体、浏览记录、手机移动信令、文献引用),采用可视化手段,对大空间跨度或者海量参与主体的社会现象进行呈现与特征计算。例如,社会学家聚焦社会信任、网络行为、文化产品,提出相关的理论与研究方法。此外,这类研究对于社会治理也具有重要价值。学者基于1亿脸书用户意见发现,在全球新冠肺炎疫情中,社交媒体上的反疫苗社群虽是少数,但在网络传播中占据更重要的位置。这意味着在公共卫生事件中,阴谋论或谣言有天然的传播优势。

  2.复杂过程的仿真和模型。要对复杂过程进行既尽量真实又删繁就简的再现,社会科学家主要通过多主体仿真建模或数学建模来制造一个人工社会。例如,小世界、结构洞和弱关系理论认为,网络中人群间的连接有利于观念扩散。但仿真建模发现这一判断依赖于微观前提:个体间须持有“物以类聚人以群分”的相互学习同化态度。一旦个体间存有仇视分化的态度,那么人群间只需少量连接就能够快速引发观念的极化和对立。再如,基于近千万人的日常出行手机信令数据及新冠肺炎病例分布,学者通过构建虚拟接触网络发现限制餐厅、咖啡馆等场合的客容量,比一刀切限制所有场所开放在疫情防控方面更有效。

  (三)基于宏观社会变量的实证关联分析:宏观理论的统计检验

  在宏观定量社会学中,对宏观理论假说进行统计检验,是和传统定量分析最为接近的取径。值得一提的是,中国学者在这一领域起步较早并基于中国数据进行了系列研究和呈现。这类研究可根据因变量、自变量的大数据来源分为两类:

  1.因变量和自变量均来自大数据。例如,有研究聚焦美国的少数社会组织的激进程度是否影响主流媒体的话语。为构建因变量,学者采用查重工具来比较反穆斯林组织原创新闻与主流媒体报道的文字差异,并将其作为Y。为构建自变量,则运用主题模型识别此类组织每篇新闻稿与其余组织新闻稿的主题差异,并将其作为X。又如,学者从歌曲数据库中搜集信息,以在榜单中的最高位置与周数构建歌曲流行度指标Y,同时在其他数据库中寻找每首歌的特征指标(如长度、艺术家知名度)作为系列解释变量X。再如,学者为验证当代中国互联网文化传播中的“代内反授”现象(也即年龄相差仅仅数岁的一代人内出现文化代沟),利用数百个网络热词的新浪微博使用热度作为“传授”X,以百度的搜索热度作为“学习”Y,然后进行基于时间序列和面板的计量模型分析,发现代内的反向社会化关系。

  2.因变量或自变量来自大数据。大数据能提供以往大时空跨度的社会学关键指标。例如,为验证马克思主义理论对20世纪发达资本主义国家仍具有高度的解释力,学者以美国为例,检验其社会阶层意识和宏观经济指标之间的长期关系。为测量百年来美国人对阶层的关注度,该研究使用数字化图书语料库,通过计算美国出版书籍中与阶层相关单词的词频来生成“阶层意识指数”(Y)。基于条件格兰杰模型分析验证了四年内的通货膨胀率和失业率(X)可用来预测美国社会公众的阶层意识,为经典理论提供了时代新证。又如,学者对广为流传的“维特效应”理论(也即书籍引发模仿性自杀)进行大时空尺度的宏观检验:使用大数据语料库创建“书籍中的自杀”(X),检验其与美国真实的自杀率(Y)之间的时间序列关系。在这项研究中,除了核心自变量之外,其他控制变量如“新闻中的自杀”“电影中的自杀”等也来自新闻语料库和互联网电影资料库等大数据平台。

  (四)基于宏观微观双重数据的多层研究:厘清区群谬误

  如果宏观关联分析的X—Y与微观关联分析的X—Y是对应耦合的,那么社会学家可以从实证的角度,以宏观微观机制对比的立体视角,进一步加深对X和Y间因果共变关系的理解,深度解决区群谬误问题。这是因为,无论是通过涌现、复制还是跃迁,个人层面的X—Y因果关系总会在宏观层面产生相应的结果。如果仅研究其中一个层面,未免会让是否存在区群谬误成为悬而未决的理论空洞。例如,要研究信仰虔诚度与幸福感之间有无因果关系,我们首先应该在微观层面进行回归分析,使用随机调查样本来建立个人层面的因果关系。但这只是研究的第一步。为深度了解信仰与幸福感之间的因果关系跃迁,在数据允许的条件下,我们应该进一步进行宏观层面的定量分析,例如将城市平均幸福水平与信仰的空间分布联系起来,对城市样本进行模型回归。显然,城市层面数据可以来自大数据:从具有时空标签的互联网平台获取公众的社会态度信息。一旦城市层面的面板数据分析可以建立信仰与幸福感的宏观因果关系,那么我们就进一步追问这种宏观关系与个体层面的微观关系是否一致?如果一致,是否说明X和Y在从个体向宏观的汇聚过程中,起主导的是叠加和重复效应,而非其他的非线性影响。与之相对的,如果宏观微观层面因果关系不一致,那就应该更为深入地探究区群谬误为何存在。

  四、宏观转向的本土使命:构建中国特色社会学话语体系

  自20世纪80年代中国社会学重建以来,定量研究获得了长足进步和迅猛发展,逐步成为中国社会学的核心组成部分和前沿地带,并在诸多领域引领中国与国际社会学的接轨与对话。特别是在社会分层流动、社会网与社会资本、教育、婚姻、性别与家庭等领域,积累并形成了较为成熟的教学科研体系。中国定量社会学的快速发展,得益于80年代华人学者林南、美国学者布劳等对国际研究范式特别是美国社会学的引介,更得益于一大批有国际国内扎实定量训练基础和卓越研究成果的中国社会学人的薪火相传。重要的是,中国定量社会学在积极接轨和对话国际学界的同时,也在本土化的道路上进行了重要探索,在概念体系、理论建构、数据采集和研究方法等领域都取得了丰硕的成果。

  不过,我们也看到,中国社会学自80年代重建以来,其发展路径主要还是后发依附式的:理论研究多以欧洲社会学为蓝本,而实证特别是定量研究多以美国社会学为蓝本。这种模式,为学科的迅速重建和快速发展起到了不可替代的作用,但也向中国社会学引入了西方特别是美国社会学发展中已然存在的不足——定量研究的“微观旨趣”就是其中之一。对中国的定量社会学研究而言,忽视宏观的路径依赖,除了带来前文提及的学科视野窄化、研究方法固化、理论观照矮化等危机之外,还被其他本土因素放大并形成学科发展的阶段性瓶颈。具体表现为:

  第一,以论文数量、影响因子论英雄的科研考核体系,一度鼓励了盆景式、纤巧型的定量研究。第二,研究视野几乎仅限于当代中国,缺乏对中国的历史社会、近代社会、改革开放前30年及国际社会的大时空关注和全球问题意识。第三,理论观照局限于对西方陈说在中国情境中加以检验。尽管这一移植式的研究模式,在很大程度上减少了人文社科研究中常见的制造概念、过度解读等弊端,但也导致了本土化理论建构的不足。其代价就是,快速崛起并接轨世界学术舞台的中国定量社会学,在全球学术竞争中话语权较弱,在全球治理中影响力较小。虽然中国社会学有了较为完备的学科体系,但学术体系特别是理论体系的发育还不健全,定量社会学在理论体系、话语体系构建方面,更远未发挥出其应有的作用。

  社会学定量研究的宏观转向,特别是基于大数据的宏观定量社会学,将加速推进具有中国特色的社会学话语体系的构建。这一转型使命包括六个方面。

  1中国宏观定量社会学的问题意识:从西方理论的传统渊薮,走向中国之治的聚焦导向。中国社会学的后发依附模式,一度使得实证研究的主要关注领域,多来自西方社会发展实践中的传统议题甚至特征化问题。一方面,社会分层、跨国移民、教育回报、女性权力等社会学研究概念和知识体系,多扎根和提炼于西方社会治理的百年经验,其相关议题的时空背景和理论蕴含往往不能涵盖中国社会发展的理论化对象。另一方面,中国社会治理中已解决或待解决的很多议题,在当代社会学中还没有得到足够的重视:如基于中国幅员和人口特征的巨型城市群发展、海量人口的国内流动与城镇化,基于中国政治特征的多级治理体系、公共管理应急体系、教育与医疗改革、乡村治理和精准扶贫,基于中国教育和文化传统的高考遴选制度……本土问题意识的缺乏和学科知识体系的惯性,使定量研究者在从选题构思、设计问卷到测量指标和模型分析的全过程中,都往往难以跳出西方定量研究的窠臼。不过,形式多样的大数据为重新培育中国定量研究者的本土问题意识提供了重要资源:多来源大数据正以空前的信息跨度、精度和充裕度记录着当代中国社会治理的过程,也以宏观视野来驱动研究者回归本土议题、聚焦中国之治。近年来,一批围绕中国治理探索与成就的大数据论文与专著,已在国际国内知名出版机构和社会学刊物崭露头角并引发学界关注。

  2中国宏观定量社会学的理论担当:从西方理论的中国旁证,走向中国理论的话语建构。人类社会的自然禀赋资源和人文历史脉络千差万别,因此理论之树必然是多面向和多对象的。中国的宏观定量社会学不满足于对既有西方社会理论在中国进行宏观检验,而是在学科积累的基础上,探索本土宏观理论的提出和体系构建:大数据蕴含大现象、大规律,能够引致新的大理论、大发现。例如,通过质性分析,中国学者在20世纪90年代就提出代际“文化反哺”现象。在此基础上,学者利用宏观定量社会学的大数据方法进一步拓展修正,发现随着网络新媒体的应运而生,反向文化传播已从“代际反哺”走向“代内反授”。再如,自80年代以来华人学者在社会资本和关系研究领域对西方理论进行了卓有成效的拓展与积累,但总体理论抱负仍然是对个体层面的关系效用进行统计检验和因果推断。而新近的研究开始利用宏观时间序列和大数据对区域层面的关系文化特征进行时空差异与机制分析。这些研究的探索意义并非止于简单的数据更新,而是在源自欧美的代际文化互动、社会网络理论之外,开辟出富有中国理论潜力的前沿地带,尝试中国理论特别是话语体系的构建,通过“提炼标识性概念,打造易于为国际社会所理解和接受的新概念、新范畴、新表述,引导国际学术界展开研究和讨论”。

  3中国宏观定量社会学的服务能力:从本土现象的微观聚焦,走向“国之大者”的战略研究。囿于微观旨趣,长期以来中国的社会学定量研究过于专注微观层次的机制挖掘,这在很大程度上限制了其服务国家战略、参与重大课题项目的能力。前文提及,宏观定量社会学的分析层次和样本往往是行政区划单位,这本身就已决定了它将是社会学贡献和服务于国家现代化治理能力建设特别是大国治理的关键领域。也即,基于大数据的宏观定量社会研究在服务国家战略方面较之传统定量分析更具优势、更有力量、更为直接。在近年来的国家重大、重点和一般社科基金项目中,围绕大数据、机器学习等新兴研究对象和方法的课题,已开始全面覆盖人文社科各大领域。此外,大数据为中国定量社会学打破了传统调查数据的国别限制和有限视野。在过去,中国学者囿于经费、人力和时间成本,社会分析对象几乎只能是中国样本、中国个体。但随着大数据的引入,中国学者已经开始借助新型信息资源,以更为自信的“平视”视角来观察与解剖国际社会,以更为主动的姿态和清晰的视野来审视影响人类命运共同体的重大现实问题(如前文提及的中国学者对美国社会阶层和自杀的研究),以此致力于向全世界贡献社会学维度的中国智慧、中国方案。

  4中国宏观定量社会学的历史观照:从当代社会的短焦详察,走向兼顾中华文脉的长焦远读。当代中国社会学定量研究缺乏历史观照原因有三:第一,研究对象严重依赖于当代社会调查问卷数据。数据的时间限制,导致研究者几乎把全部注意力都集中在对当代中国特别是改革开放以来社会转型期的考察之中。第二,研究方法的分野,导致定量研究学者的传统历史文化熏陶和训练,总体上逊于从事理论研究特别是人文研究的学者。文理兼通且不被科学主义主导的定量学者数量仍然不多。第三,学术传统倚重美国社会学定量研究,但美国社会学的历史观照本身就有不足。美国社会学特别是定量研究在全球社会学中具有巨大的影响力。美国文化虽上承英国、远溯希腊罗马,但建国时间较短和科学主义特征使得其研究往往缺乏欧亚同行的历史视野和文化观照。所幸的是,宏观定量社会学依靠大时空跨度的大数据,可形成对传统分析时间框架的突破,甚至让定量研究者在不具备理论或人文研究同行那样专业的文史训练背景下,仍能实现对历史数据、文化资料的远读、量化和总览,甚至催生新的概念、观点和理论。

  5中国宏观定量社会学的人才培养:从单一的个体科研训练模式,走向教学相长的立德树人团队模式。当代中国定量社会学的人才培养,主要是结合了以美国社会学为代表的知识体系训练和中国传统文科的师承模式。这一借鉴和整合,在重建中国社会学的过程中起到了关键的历史作用,为今天中国定量社会学的繁荣奠定了重要基础,但也形成了一些人才培养方面的弊端,主要体现在:教育教学中重技巧养成、轻思维培育,专业训练中重数理模型、轻问题意识,评价体系上重论文发表、轻社会服务,甚至容易形成一种重术轻道、躲进小楼成一统的研究自闭倾向。这些问题,进一步被定量研究的“微观旨趣”所放大甚至固化。定量社会学的宏观转向,特别是基于大数据的宏观定量社会学发展,可以在人才培养方面为破解这一困局提供探索。这是因为,宏观定量社会学研究对象时空跨度巨大、信息结构复杂,这使其既适合成为全方位学术训练、宏观理论思维养成的专业领域,更对团队协作能力和社会服务意识提出要求,有利于促进跨专业、跨机构、跨地域、跨场域的学术合作,有利于复合型人才的梯队培养。此外,对海量社会时空信息的远读和详察,本身就是以可信、可视的方式来树立和培养正确的价值观、历史观和世界观的人文化成过程,也是把立德树人贯穿于科学研究全过程的学科实践。

  6中国宏观定量社会学的传播使命:从仰视或漠视西方学术平台,走向全球学术平台中的竞争和主导。这里的传播,包括两层含义:第一,具有中国特色、中国风格和中国气派的哲学社会科学成果,必须在全球学术平台去传播。我们既不能止步于中文世界而漠视西方平台,也不必以仰视的心态渴求学术成果在西方载体的刊发,而是要以自信的心态在全球学术竞争中形成国际学界公认和推重的中国学派。自然科学和哲学社会科学服务“国之大者”的路径大相径庭。前者没有国界,而后者有着深刻的文化和意识形态源流。也因此,对于前者,习近平要求“广大科技工作者要把论文写在祖国的大地上,把科技成果应用在实现现代化的伟大事业中”; 对于后者,他强调“但实际上我国哲学社会科学在国际上的声音还比较小,还处于有理说不出、说了传不开的境地”,要面向全世界“着力提出能够体现中国立场、中国智慧、中国价值的理念、主张、方案”。 第二,真实、立体、全面的中国形象,需要充分的数据和学理来支撑和检验。学术成果不是新闻,但它往往是传播的内容源泉,其本身的扩散甚至比新闻具有更权威的力量。习近平在2021年5月第三十次中共中央政治局集体学习讲话中指出,要加强和改进国际传播,树立真实、立体、全面的中国形象。实际上,国际传播并不仅仅是新闻界、外交界的事情,学术传播对于国家形象、文化形象和软实力的传播也具有重要意义。在定量社会学、计算社会学等领域,当前中国优秀学者在国际知名期刊发表文章以及担任主编、顾问、编委的越来越多。此外,随着中国学者规模、学术质量以及中国人创办的国际学术载体数量的不断扩大和提升,基于中国数据、讲述中国理论的成果在全球学术舞台中不断涌现。在传播中国声音方面,基于大数据的宏观定量社会学更具有独特的优势:它能够及时、实时地捕捉国际国内社会公众心态、行为和林林总总的经济社会文化指标并进行科学分析,以客观、权威的学术作品方式,向国际舞台和全球公众推送中国之治的成果、中国道路的自信和中华文脉的传统。

   结语

  虽然宏观研究一直是社会学的核心领域之一,且深深根植于马克思、涂尔干等社会学开山鼻祖的奠基之作中,但当代定量社会学研究的视角过于聚焦微观层面,形成了研究取径上“微观旨趣”的路径依赖。然而,社会现象、社会关系和社会过程,如制度、法律、文化、经济等都兼具有宏观和个体两个层面的特征,也往往无法通过基于个体层次的微观分析而得到完整的观测和分析。在这个意义上,当代定量社会学作为社会科学的维度完整性,存在重要的缺憾。这种缺憾,直接影响了定量研究对于社会学的总体贡献和影响力,也引发了学界从多个角度和层面对定量研究的批评与质疑。尽管定量社会学者一直具有在反思中改进的学科传统,但从本体论和研究层次等角度进行的回顾并不多见。本文希望能借助新一轮更底层的反思,坚定地推动定量社会学研究走向更为广阔的天地、承担起更为重要的学科和社会使命。

  在宏观层面上获取社会指标和有效数据,长久以来是实证社会研究的软肋。更重要的是,本体论整体主义的社会主体含糊性,使得几十年来定量研究者总是有意无意地回避宏观层次的研究,遑论区群谬误从20世纪60年代开始就让宏观分析成为研究的雷区。不过,当社会学家可以获得和驾驭海量大数据时,这一学科的隐痛,终于可以通过重启宏观观照而逐步消解。大数据对定量研究的贡献在于:空前的信息时空覆盖和复杂程度,使得传统调查问卷等方法所不能测量的宏观社会指标和复杂系统特征,都能够被学者所挖掘和利用。结合大数据和计算社会科学方法,我们能对宏观社会现象和过程进行结构展示、规律发现、关联分析和实验模拟。

  当然,定量社会学研究的宏观转向,绝不仅是大数据或社会计算方法对传统数据模型的简单替换。在这一转型过程中,我们既鼓励新型数据和技术的应用,更倡导学者以前所未有的力度和深度来传承社会学理论传统、承担服务“国之大者”的责任。同时,仅凭社会理论的积累和个人灵感,亦难以在这个时代展开既富有社会学想象力又逻辑缜密、视野阔大、洞察精确的研究。因此,当代社会学定量研究的宏观转向作为学科的革新与拓展,是理论、数据和治理的三元驱动的统一,通往的是高度理论导向的宏观社会学。它的新生、发展和成熟,非但不会损害社会学的伟大传统也是永恒主题——想象力和批判性思维,而只会为这一传统提供更为扎实的证据和洞察力。因此,这一转向还具有深刻的本体论与认识论意义:改变了信息来源、改变了分析工具,我们也就改变了社会学知识的对象。

  更值得关注的是,当代社会学定量研究的宏观转向,为进一步推动中国社会学的本土化和国际化进程,提供了新的机遇和动力。社会学没有国界,统计模型、大数据、程序算法等本身更没有地缘差别,但中国社会学家有自己的祖国和重要的时代使命——构建中国特色社会学话语体系。这个话语体系的构建,一方面是中国社会学研究的问题意识和理论体系不断强化的本土化进程,另一方面也是中国社会学研究的全球话语权、影响力不断提升的国际化进程。这两个进程相辅相成:没有中国理论不成为中国体系,缺乏国际影响力无法形成中国话语。而基于大数据的宏观定量社会学,从一开始就深具本土化和国际化有机结合的“中国化”特征。

  在本土化方面,当代定量社会学宏观转向的特征主要是进一步强化扎根中国的问题意识和理论自觉。这既是社会学属性和社会学人家国情怀的内在驱动,也是中国的新时代本土情境、大数据本土资料对中国理论的呼唤。这一宏观转向,能够让我们用全新的观察层次与视野、空前的规模与精密的研究数据,为中国社会学理论体系构建打开一扇新的大门。在国际化方面,基于大数据的宏观定量社会学,其中国研究群体从一开始就在全球学术竞争中处于前沿甚至引领潮流的身位。在某种意义上,他们已初步告别了长期以来对西方社会学亦步亦趋的学术模式,为中国社会理论的全球发声做出了有力的探索。这种探索,是在全球学术舞台的中央所展开的:好的理论生于中国、长于本土,也一定能且必须以国际化的形式踏上和主导全球理论舞台,或引发智识辩论,或启迪后发思考,但总能够解释以往西方学界所未能解释的现象、未有关注的问题,形成全世界听得到的中国声音。

  最后要强调的是,基于大数据的宏观定量社会学是“计算社会学”的重要组成部分,其在当代中国的发展,深具天时、地利与人和的重要优势。我国拥有全世界最多的人口和互联网用户接口与数据,移动数据客户端使用普及程度也远超西方;而有力的政治体制和巨大的国土幅员,使得中国的社会发展总体上呈现出一种独特的同步性与异质性的高度整合。在百年未有之大变局中,中国之“大”,既对研究者提出了更多的大理论挑战,也为研究者透视大时空、解析大数据提供了更多的战略机遇。当代社会学定量研究的宏观转向,是从“微观旨趣”主导走向“宏观观照”兼顾的过程,是中国社会学的自我革新精神与不懈理论追求在新时代的回响,是对习近平总书记关于量化范式重要性论述的贯彻与响应:“对现代社会科学积累的有益知识体系,运用的模型推演、数量分析等有效手段,我们也可以用,而且应该好好用。”

  本文注释内容略

原文责任编辑:冯小双

转载请注明来源:中国社会科学网(责编:常畅)

扫码在手机上查看