面向统计数据应用战场,赋能现代统计科学体系

——写在《互联网统计学:方法与应用》出版之际

2023-09-20 来源:中国社会科学网

微信公众号

分享
链接已复制

  从收集、处理、分析、解释数据到从数据中得出结论,统计学是集统计数据、统计方法与统计决策于一体的科学。尤其是随着互联网技术的发展,人们的生产生活方式、社会的组织结构和内在关系均发生了翻天覆地的变化。与此同时,数据生成、获取、存储、处理技术也在发生着日新月异的变化。在互联网背景下,统计学仍然是数据分析的灵魂,将在数据处理和分析中发挥着重要作用。

  咬定青山不放松,立根原在“数据”中

  记得清代诗人郑燮曾写过一首诗《竹石》:“咬定青山不放松,立根原在破岩中。千磨万击还坚劲,任尔东西南北风。”每每品读,在感慨竹子那顽强而又执着的品质之余,总会注意到在“咬定”与“坚劲”的背后,是“破岩”之立。这“根原”所在便是统计数据。

  作为统计学的研究对象,现代统计科学体系中的统计数据存在多样性、广泛性和规律性的特点。多样性是指包括各种数字、文字、图像、视频、音频等数据在内的丰富的统计数据类型。广泛性是指涉及经济、政治、文化、社会、生态等诸多领域,以及不同领域交叉融合形成的复合型领域、随行业发展而生的新兴领域。规律性是指在统计学意义上具有一定的共同属性且真实存在一定的统计规律。

  统计数据所传达的故事与价值来自社会、经济、科技、教育和医学等具体的应用领域。面向社会数据,统计学会关注城乡职业收入的影响因素,抑或是中老年家庭收入与医疗保健支出问题。面向经济数据,统计学会关注个人所得税的税收发展状况,抑或是全产业链结对子发展的路径选择。面向科技数据,统计学会关注全球化国家科技创新能力研究,抑或是科技文献数据主题挖掘。面向教育数据,统计学会关注高等学校科研办学效率的绩效分析,抑或是教育现代化水平监测指标体系的构建与动态评估。面向医学数据,统计学会关注医学指标间的网络关系,抑或是中医宗气综合变量的构建及诊断效果。

  兵戈铁马行天下,战士威风震万乡

  唐代诗人王昌龄在《出塞二首·其一》一诗中曾写到“兵戈铁马行天下,战士威风震万乡。”统计学中的统计方法,是 “行天下”之“兵戈”,是“震万乡”之“战士”。简单来说,现代统计科学体系中的统计方法,是基于不同类型的数据分别构建统计模型,从而对数据中存在的有用信息和价值规律进行挖掘和分析。其中,用于统计计算的统计方法,可以理解为对实际问题中的数值计算和数理推导相关的统计学问题和计算机技术。

  如果说,工具是人类用来改造世界的重要手段,那么统计方法则是征战统计应用战场最核心的要素之一。面向社会数据,统计学可以将分位回归模型应用于城乡职业收入的影响因素研究,抑或是运用多重插补方法替换中老年家庭收入缺失数据。面向经济数据,统计学可以将时间序列预测模型用于个人所得税状况预测,抑或是将函数型聚类分析方法用于全产业链结对子发展的路径选择。面向科技数据,统计学可以将结构方程模型用于全球化国家科技创新能力评价,抑或是将主题模型用于科技文献数据主题挖掘。面向教育数据,统计学可以将数据包络分析方法用于高等学校科研办学效率的绩效分析,抑或是将综合指数编制方法用于教育现代化水平监测。面向医学数据,统计学可以将社会网络分析方法用于医学指标间的网络关系研究,抑或是将基于分位数的二阶因子模型与ROC曲线用于中医宗气诊断效果评价。

  工欲善其事,必先利其器。面向社会、经济、科技、教育和医学五大领域,统计软件包括但不限于EViews、UCINET、R和Python的运用。其中,EViews和UCINET是通过点键式操作即可完成分析任务,EViews常用于时间序列数据分析与预测,可以满足经济领域数据从特征分析到复杂建模的需求;UCINET主要用于描述节点间关系的社会网络分析,可以用于但不限于医学领域指标数量过多且关系复杂的网络关系分析。R和Python都需要编程实现所有统计分析任务,不限定应用领域。与Python相比,R的发展时间较长,而随着时间的推移,Python的功能也在逐渐完善,尤其在大数据分析领域,Python发挥着重要作用。

  冲天香阵透长安,满城尽带黄金甲

  记得唐代诗人黄巢的《不第后赋菊》写道:“待到秋来九月八,我花开后百花杀。冲天香阵透长安,满城尽带黄金甲。”在现代统计科学体系中,通过统计数据和统计方法得到的有用信息和价值规律,将是形成“透长安”之统计决策。

  面向社会数据,在深入研究中老年群体的收入现状、提高医疗保健支出等研究课题的前提下,从以下三个方面提出政策建议。

  一是在保障制度层面向中老年群体收入倾斜。在逐步加大经济保障覆盖面、加快薪酬福利制度落地的基础上,建立和健全中老年人的补贴制度,尤其向城镇社保未覆盖的职工家属及农村人口中的老年群体的家庭收入适当倾斜。不仅按原有额度发放退(离)休金,还要建立保值优惠机制,在保障基本生活条件的同时补给适应市场消费水平的收入差额。探索建立责任共担的福利服务制度,政府承担主体责任,合理分担家庭供养责任。

  二是在医疗卫生资源层面改善医疗保健环境。进一步增加我国医疗卫生机构数量、卫生人员数量、村卫生室的提供数量、医疗卫生机构床位的提供数量、乡镇卫生院医疗服务的提供数量及卫生总投入。通过医疗卫生制度的不断革新和政府部门的有效介入,加快推动我国医疗保健资源配置的逐步优化。加大我国政府卫生支出、社会卫生支出,减少中老年人在医疗保健方面的个人支出,营造“保健无忧虑、看病无负担”的医疗保健生态。

  三是在反馈通道层面关注中老年群体的多元化需求。进一步畅通中老年群体在家庭收入和医疗保健方面需求的反馈渠道,及时收集、归纳不同中老年人的实际困难和真实诉求,建立多元化的医疗保健体制,为中老年群体反映的不同问题给予具体指导和帮助,有效地跟踪和解决问题。针对患有重大疾病但经济基础薄弱的中老年群体,应开辟“绿色通道”满足治病就医需求,多关注中老年群体的精神生活,将心理呵护纳入医疗保健体系。

  面向经济数据,在针对我国不同地区“结对子”发展路径选择进行研究的基础上,可从以下三个方面提出政策建议。

  一是做好顶层设计,加强全局谋划,用好政策“指挥棒”。制定省际互促发展专项政策,与当前京津冀协同发展、长江经济带发展、粤港澳大湾区建设、长三角一体化发展、黄河流域生态保护和高质量发展等一系列具有全局意义的区域重大战略共谋共划。在人口流动、资金流转、技术转移、信息互通等关键领域打通省际合作体制机制堵点,促进资源要素自由有序流动。创新政绩考核制度,打破行政壁垒,推进省际产业协同创新、基础设施互联互通、生态环境共保联治、公共服务便利共享,缩小省际发展差距,构建优势互补的高质量互促式发展格局。提高政策协同性,保持政策连续性,避免出现“运动化”“形式化”等局面。

  二是精准识别各省产业特征,强化比较优势。改革开放以来,我国区域协调发展取得显著成就,基本形成了西部大开发、中部崛起、东部率先发展的阶梯式发展格局,加之产业基础、人才技术、市场网络等因素造成的各省发展差异已成为当下的区域协调发展的客观现实,因此,在实践中要尊重客观现实,把握产业规律,深挖各省产业发展特征,按照宜水则水、宜山则山、宜粮则粮、宜农则农、宜工则工、宜商则商的原则,支持全国各省走合理分工、优化发展的路子。运用现代大数据分析等信息技术手段,精准识别与各省资源禀赋、已有产业、技术积累等相适应的产业方向,进而不断强化产业比较优势,推动形成优势互补、高质量发展的省际“结对子”互促发展格局,为促进全体人民共同富裕提供坚实支撑。

  三是坚持协同联动,打造开放包容的交流合作模式。探索建立新一代信息技术知识产权保护、交易服务平台,探索建立知识产权资本化运营和收益分享机制。跨省开展前沿技术研讨,项目对接洽谈等活动,深化与国家和地方重点协(学)会战略合作,引进一批重大项目,支持构建以企业为主体,高校科研院所、行业协会、非营利性组织、政府等共同参与的产业创新生态联合体,加快培育一批“雏鹰”“瞪羚”“独角兽”、单项冠军、专精特新“小巨人”、科技型龙头等产业领军企业。促进地方人才交流,重点引进一批从事国际前沿科学技术研究、带动新兴学科发展的杰出科学人才和团队,鼓励国内外各类高层次人才采取柔性流动的方式参与产业建设,指导、支持企业和研发机构参与国际标准的制定,鼓励本地企业参与国际认证合作。

  【本文系国家自然科学基金委青年科学基金“高维变系数多水平结构关系模型研究及应用”(72001197)阶段性研究成果】

  (作者系中国科协创新战略研究院副研究员)

转载请注明来源:中国社会科学网【编辑:毕雁 实习编辑:余金金】