一、作者简介
汪荣明,1997年毕业于华东师范大学,获理学博士学位。现任上海对外经贸大学校长、教授、博士生导师,享受国务院政府特殊津贴专家。主要学术兼职为国务院学位委员会统计学科评议组成员,教育部高等学校统计学类专业教学指导委员会副主任委员,中国现场统计研究会副理事长,《Applied Stochastic Models in Business and Industry》 (SCI) 和《Insurance: Mathematics & Economics》(SSCI) 编委。
主要研究方向为保险精算与金融风险管理。在国内外概率统计及保险精算学核心期刊上发表论文50余篇。主持高等学校学科创新引智计划(“111”计划)、国家社科基金重大项目、国家社科基金重点项目及多项国家自科基金、国家社科基金等项目的研究工作。相关研究成果曾获上海市决策咨询研究成果奖一等奖,全国统计科学研究优秀成果奖二等奖等奖项。
二、专著简介
在数据爆发式增长的时代背景下,如何利用大数据要素,对健康保险进行个性化、多维化和动态化定价,并自动、精准、高效地检测和预警健康保险运行风险,推进健康保险持续健康发展,是完善我国多层次医疗保障体系亟待解决的首要问题。
在《大数据背景下健康保险的精算统计模型与风险监管研究》一书中,作者在构建健康保险大数据融合新方法的基础上,探究了大数据背景下医疗保险、重大疾病保险及长期护理保险的精算统计模型优化与创新;并进一步分析了医疗保险风险欺诈识别与健康保险风险控制监管的新思路,为研究如何利用大数据分析技术提升健康保险风险管理水平提供了重要参考。该书主要有以下四方面的学术创新与重要应用价值:
第一,针对多源数据融合面临的数据量大、多源异构、碎片化等问题提出了相应的数据处理方法,弥补了多源数据处理技术的不足。现阶段健康保险数据来源与使用较为单一,缺乏对多源数据处理的相关研究。该书立足于多源数据特点,在处理海量数据时,提出了分布式算法和最优子抽样方法;在处理多源异构问题时,提出基于密度比的经验似然方法;在处理数据碎片化问题时,提出数据插补和模型平均两类方法,为健康保险精算统计模型的数据融合提供了理论与技术基础。
第二,将健康保险大数据方法应用于健康保险定价,提升健康保险精算的科学性。在商业医疗保险定价中,通过随机森林分类模型和回归模型对个体患病概率及每个病种的治疗费用进行预测;在长期护理保险定价中,结合BP神经网络模型及离散时间多状态Markov模型,在合理定价假设下进行费率厘定;在重疾险定价中,结合朴素贝叶斯模型及连续时间Markov模型进行定价。同时,在导入被保险人健康数据后,基于大数据构建的隐马尔可夫模型可对健康保险费率进行实时动态调整。在大数据技术的支持下,该书实现了健康保险定价模式得以向精准定价和动态定价的转变。
第三,构建大数据背景下医疗欺诈识别和风险预警模型,为健康保险的风险监测提供新的技术思路。针对大数据背景下健康保险道德风险管理的理论模型缺失问题,及传统计量方法在构建健康保险风控模型时必须依赖较强数据分布与参数假设的局限,该书提出的K均值聚类方法、LightGBM方法、Logistic算法和决策树算法,可自动、精准、高效地检测和预警医保欺诈行为,为医疗保险基金长期稳健运行提供了技术与方法保障。
第四,提出基于HL7-RIM的健康保险业务底层数据标准化模型,为未来保险业大数据标准化提供前期基础。针对大数据时代的健康保险数据非标和口径不统一问题,该书基于HL7-RIM构建健康保险业务底层数据的标准化模型,并通过与现有的健康保险业务要素专项数据规定进行比较,验证了该模型的优越性,为健康大数据的广泛应用提供标准化基础。