内容摘要:
关键词:
作者简介:
内容提要:公共安全数据管理是近年来兴起的一个交叉学科研究领域。文章梳理了公共安全数据管理兴起的背景,从“数据管理”“数据监管”和“数据治理”等不同概念下开展的数据研究出发,辨析并明确了公共安全数据管理的内涵,重点对公共安全数据管理的主要研究内容进行了归纳,并总结了公共安全数据管理给相关研究与实践提出的新问题。
关 键 词:公共安全;数据管理;数据科学;领域大数据;公共安全治理
作者简介:沙勇忠,男,兰州大学管理学院,兰州大学应急管理研究中心教授,博士生导师;陆莉,女,兰州大学管理学院,兰州大学应急管理研究中心博士研究生。
基金项目:本文系教育部哲学社会科学研究重大课题攻关项目“大数据驱动的城市公共安全风险研究”(项目编号:16JZD023)与中央高校基本科研业务费专项资金资助重点项目“基于大数据的城市公共安全风险预警研究”(项目编号:17LZUJBWZD012)研究成果之一。
1 引言
大数据时代,数据正在改变着组织的决策因素和管理模式,领域导向的大数据价值开发与利用是实现大数据驱动的管理与决策面临的重要挑战之一[1]。然而数据价值的实现离不开对数据本身的管理,在不同行业领域由于认知局限和管理策略不当大量数据正面临着丢失、不可读、信息损失、共享和复用困难等风险[2],越来越多的研究者和管理者认识到数据管理是组织不可忽视的一项重要工作。只有在厘清业务系统的基础上强化原始数据的管理,才能实现从数据到信息再到知识和智慧的升级转化[3]为管理与决策创造价值。总体来说,数据管理是一个新兴领域,目前相关研究多集中在科学数据管理,强调从科研活动和场景出发对研究活动中产生或需要的数据进行管理。但是,单纯从科学数据管理角度出发,对其他不同领域数据管理活动进行理解已显现出其解释力偏弱和适用性不足等问题。因此,不同领域的数据管理需要跳出科研数据管理的既有界定,结合领域差异性和管理主体特征,对数据进行体现领域内在规定性的处理和解读,才能实现数据管理对领域场景决策和行动的价值。
公共安全作为面对复杂性系统问题的一个管理领域,对数据和数据管理有其特殊的领域敏感性和应用要求。公共安全数据是指在公共安全活动中产生或通过其他方式所获取的,能够反映公共安全活动的现象、特征和规律,进而支持管理决策的原始数据或经过加工整理的各类数据集,具有明显的多源异构及价值密度低等大数据特征。其大数据特征使注重事物发展趋势预测的大数据技术与注重风险监测与预警的公共安全治理思维在运行逻辑上同轨,因此公共安全数据已在智慧交通、智慧消防、食品安全的智慧监管、社会治安综合治理与精准防控等公共安全领域发挥了重要的作用。作为政府部门的战略性资产,公共安全数据中蕴含了巨大的社会管理价值、公共服务价值和科学研究价值。但目前公共安全活动中普遍存在重技术应用而轻数据管理、重基础设施建设而轻数据集成规划等问题,对数据认知和管理意识的缺乏成为阻碍大数据在公共安全领域价值发挥的关键问题。
公共安全数据管理作为一个新领域和新方向的提出,将重点致力于解决以下问题:一方面从技术角度关注多源异构公共安全数据的集成、处理与分析过程,另一方面重视公共安全治理活动中贯穿整个数据生命周期的内外部管理要素和数据的应用情境;通过从数据科学和公共安全的交叉结合中寻找逻辑起点,准确理解公共安全数据管理的内涵,发展公共安全数据管理的知识体系,进而推动数据驱动的公共安全管理实践发展。
2 公共安全数据管理的兴起背景
2.1 大数据时代公共安全治理实践对数据管理提出新要求
在风险社会的时代背景下,公共安全正在成为优先价值[4]。公共安全治理是公共管理最基本的职能,也是社会发展和公共利益实现的根本前提[5],提升公共安全治理能力和治理水平已成为政府管理部门的重要任务。但现阶段我国公共安全治理仍面临注重事件和危机的应急处置管理而忽视公共安全风险治理,公共安全治理的主体单一、治理技术落后等困境[6]。为提升整体治理能力和治理水平,将风险治理作为公共安全治理的逻辑起点,突出源头治理和事前的风险管控尤为重要。大数据技术与理论的发展则为实现公共安全治理中的关联分析、精准研判、动态预警和决策支持提供了信息基础、工具能力和技术平台支撑,有助于实现“预防式”的、从风险管理到应急处置再到危机管理整个流程周期的主动式、整体式治理。如北京市东城区利用大数据技术对全区居民慢性病影响因子进行关联分析验证,提供区域性病情预警服务[7]。英国交通运输部等机构的MES SAGE(Mobile Environmental Sensing System Across Grid Environments)项目通过传感器采集多样异构的数据用以支持城市级、区域级和国家级的交通规划和管理,以控制交通活动对环境产生的影响[8]。
但大数据在给公共安全治理实践带来机遇与变革的同时,大数据技术的应用与数据价值的挖掘也面临巨大挑战。大数据的海量、多样和迅速变化的特征给政府管理部门的数据管理和处理能力带来了严峻的考验,数据间关联关系的强化更加导致了不同机构间数据鸿沟问题的凸显[9]。因此,公共安全治理实践对公共安全数据的处理与管理提出了新的要求。在公共安全治理情境中,大数据功能的实现必须建立在数据充分整合和有效管理的基础上,通过跨领域、跨组织边界的数据融合,一方面从数据层面进行关联,另一方面从业务层面进行集成,才能打破数据共享壁垒,从数据中形成知识和智能,实现大数据驱动的公共安全治理,推动公共安全治理模式由“经验驱动型”向“事实驱动型”的转变[10]。
2.2 公共安全研究响应科学研究向数据密集型第四范式转变的结果
数据管理是数据密集型科研范式即科学研究第四范式的必然要求[11]。吉姆·格雷认为科学研究经历了实验科学、理论科学和计算科学阶段,目前已进入了数据驱动的第四研究范式阶段。其特点是科学研究活动面临大量的通过设备采集、仿真模拟、传感网络生成的多源数据集,研究人员需要通过系列技术和工具支持数据关联与协作,进行数据的分析挖掘与可视化探索,实现有效的学术交流与传播[12]。
公共安全治理要求多元主体的广泛参与,其中高等院校和科研机构成为研发公共安全治理工具、促进大数据技术应用的重要主体,公共安全研究也在逐步向数据密集型研究转变[13]。Thakuriah等[14]提出在借力多源数据探索城市管理的城市信息学(Urban Informatics)四个主要研究领域(即提升动态城市资源管理策略、城市运行模式及进程的理论洞见和知识发现、城市管理中公众参与策略以及城市管理规划和政策分析的创新)中,大数据能够创新研究方法,既可在已有理论研究支撑下改进现有的城市管理模型并运用大数据进行模拟仿真,也可实现数据驱动的模型构建、模式探测和知识发现,但不可否认的是,数据密集型研究同时也面临着技术、方法和认识等方面的挑战,如数据的准备和管理、数据驱动的模型构建、数据安全和隐私问题等。可见,在科学研究范式向数据密集型范式转变的背景下,不同领域的数据密集型研究均对原始数据本身的管理提出了要求。因此,公共安全数据管理是公共安全研究响应科学研究范式转变的结果。一方面为公共安全管理理论模型和管理实践效果的评价提供“数据”这一新的视角和出发点[1];另一方面也在一定程度上扩展了数据密集型研究范式的内涵,为数据密集型研究范式提供了公共安全的领域属性、理论验证和实践素材。
2.3 数据科学与数据管理的兴起提供了新思路与新方法
数据科学是从数据中归纳和提炼知识的研究[15],其目标是开展数据界的探索研究从而认识数据的各种类型、状态、属性及变化形式和变化规律,进而揭示自然界和人类行为的现象和规律[16],是涵盖新的理论、方法、模型、技术、平台、工具、应用和最佳实践在内的一整套知识体系,主要研究内容包括数据科学基础理论、数据加工、数据计算、数据管理、数据分析和数据产品开发等[17]。2013年,Mattmann[18]在《Nature》发表文章对数据科学发展愿景进行了解读,并提出数据科学需要在四个方面取得长足进步才能实现大数据在科学研究中的主动性。这四个方面是多样算法的集成与大数据架构的无缝衔接,软件的开发与数据管理保存的集成,异构数据的关联集成和自动解读,以及兼具科学素养与计算技术的研究者的培养。Mattmann指出有大量的机构如NASA地球科学分布式数据存档中心,都建立了长期的数据保存管理系统以管理、保存和传递数据,相关机构可获得平均每年一亿美元的资金投入,这在一定程度上反映了数据保存与管理的重要性,并指出机构协调是避免数据冗余、降低成本的关键。可见数据管理是数据科学这一新兴领域的重要研究内容。
与领域知识的高度融合是数据科学的重要特征之一,反之数据科学也将促进领域知识中“数据问题”的抽象提炼[17]。数据科学和数据管理研究领域的兴起也为公共安全领域数据的管理提供了新的思路和方法,使公共安全数据管理成为一个值得探索且具有交叉学科性质的新领域。目前科学数据管理的理论与实践探索走在领域数据管理的前列,有许多值得借鉴的理论与实践经验。而公共安全数据管理刚刚兴起,仅有少数学者对公共安全领域的数据特征、类型和监管体系进行了初步探索[13,19],更多研究者则关注在公共安全不同情境中多源数据的语义集成、存储处理、关联分析与行业应用等具体问题[20-23],__缺乏对公共安全数据特征、变化规律和管理活动的整体思考。由于公共安全治理活动的复杂性和动态性,实现全生命周期的公共安全数据管理面临如下问题与挑战:公共安全数据管理参与主体的角色不明,缺乏数据管理与共享意识;组织之间的数据共享缺乏协同和激励机制;不同组织采用的应用系统和数据存储设施的差异性增加了数据统一管理与共享的阻力;涉及个人隐私、密级数据管理、数据安全管理等问题的管理政策不完善等。如何应对公共安全数据管理面临的挑战、充分结合公共安全治理情境提升组织公共安全数据管理能力,数据科学与数据管理在理论、方法、模型、技术及应用等方面的成果值得借鉴。
3 公共安全数据管理的内涵
公共安全数据管理仍是一个需要探索的概念,从数据管理的相关概念出发可帮助对公共安全数据管理的内涵进行界定。从已有研究来看,不同学科领域的研究者采用“数据监管”“数据管理”和“数据治理”几个概念来开展与数据相关的研究。
“数据监管”(Data Curation),国内还有研究者译为数据管护或数据监护,主要关注对数字资源的管理和完善,尤其是关于科学数据管护的实践与理论研究是近年来e-Science、图书馆学与档案学领域的研究热点。2004年,英国创立了国家级综合数据管理机构DCC(Digital Curation Center),并将数据监管定义为贯穿数字化研究数据整个生命周期的维护、保存与增值活动,通过主动管理来降低科研数据过时与研究价值降低的风险[2]。英国联合信息系统委员会(Joint Information Systems Committee,JISC)则将数据监管定义为确保数据当前使用目的、并能用于未来再发现及再利用、从数据产生伊始即对其进行管理和完善的活动,对于动态数据集而言,数据监管意味着需进行持续性补充和更新,以使数据符合用户的需求[24]。Philip Lord等[25]认为,数据监管的定义涵盖了三个关键活动:一是全过程管理(Curation),侧重从数据的产生开始到数据的应用与重用的全过程管理,尤其要注重动态数据集的持续更新与扩充;二是归档(Archiving),关注数据的选择、存储和可获得性,并在一定时期内维护数据的逻辑完整性、物理完整性、安全性和真实性;三是长期保存(Preservation),对关键数据进行长期保存以支持数据的重新解读和再利用。Michael Witt等[26]从数据生产者视角出发关注其数据监管需求,构建了一个数据监管剖析框架用以指导数据监管活动,该框架由两部分组成:一是数据集描述,包括背景信息、数据形式、数据生命周期、应用情境信息、数据价值、关键数据抽取等内容;二是监管实践与需求描述,包括数据产权、数据组织描述方式(元数据格式和标准)、数据抽取的过程与规模、用户接入、数据搜寻与发现、数据挖掘分析与可视化工具、互操作性、数据影响力测度、数据管理(数据审计、备份与冗余管理等)和数据的长期保存(政策、格式转置、保存期限等)。总体来看,“数据监管”的重点在于对数据资源的全生命周期、全过程管理,虽然目前相关研究集中在科学数据管理领域,但相关理论成果与实践经验在政府数据管理等其他领域中具有很大的借鉴价值和探索空间。
“数据管理”(Data Stewardship and Management)的概念在计算机科学中较常出现,从信息技术的角度研究如何对数据进行获取、清洗、集成、存储和检索,重点关注数据管理的系统、方法、工具和技术等。如Bill Allcock等[27]对高性能计算网格环境中数据集的高速传输和去重管理方法进行了研究;S.Brakatsoulas等[28]研究了交通轨道数据的管理技术,包括数据预处理、数据建模和数据索引等,并通过上述技术实现车辆追踪数据的分析与挖掘;Jacquelyn Ford Morie等[29]探讨了一种面向虚拟现实个体行为研究的数据管理与可视化工具,该工具能够有效捕捉、管理和分析相关研究中生成的复杂数据,以帮助研究者更为直观地了解和可视化展示复杂数据之间的关系;T.A.Boden等[30]则探讨了美国通量观测研究网络的数据管理活动和系统,既涉及了关系数据库、数据接口与界面、文件传输服务器等数据管理基础设施的建设,也论述了如何实现控制数据库内容、自动化数据移动、跟踪数据来源、管理元数据内容以及处理频繁添加和更正等操作的实现,同时还提及了多源异构数据集成、用户数据需求分析与数据产品开发等值得进一步关注的数据问题。虽然并未有关于“数据管理”概念的统一界定,但计算机科学的研究者多在对数据处理的技术、系统、方法与基础设施等进行论述时将数据的有效存储、管理、检索与利用作为目标。此外,也有部分研究者使用“数据管理”这一概念进行科研数据管理、政府数据管理等方面的研究,其研究内涵与“数据监管”属于同一范畴,在此不再赘述。
“数据治理”(Data Governance)的学术概念源于企业对数据资产的治理。数据治理是指通过制定和实施一系列政策、程序和标准以保证组织的结构化和非结构化数据资产能有效应用的实践[31],其出发点是“将数据作为组织的一种资产”,主要目的在于通过对组织中相应职责、决策权以及角色的分配[32]来保证数据资产的完整性、准确性、可访问性和可利用性,涉及数据原则、数据质量、元数据、数据存取和数据生命周期等研究内容[33],以及在企业、政府、医院和高校等组织中的数据获取、数据共享、数据重用和数据加值等数据治理实践[34]。Adrian[35]就“数据管理”与“数据治理”的区别进行了辨析,认为“数据治理”不是一个技术概念而是一个管理概念,它关注的是谁有权并且能够对数据资产的决策负责的问题。相比于数据管理注重决策的制定执行和具体管理任务的实施,数据治理更关注决策的问责和管理效果的评估;且数据管理侧重数据内容本身的管理,而数据治理既包括对数据也包括对相关利益主体的管理[32]。黄璜[36]在对美国联邦政府数据治理的政策与结构进行分析时指出,政府数据治理可以分为宏观、中观和微观三个层面:宏观层面的政府数据治理,是政府作为治理主体对数据产业、数据经济乃至整个社会数据化过程的宏观治理,如国家数据战略;中观层面的数据治理介于宏观和微观治理之间,是政府对在社会公共事务治理中所产生或需要的数据资源的治理,涉及政府数据资源的利用、共享和开放等核心议题;微观层面的政府数据治理,是对政府机构在行政管理过程中所产生和使用的数据,尤其是信息系统中所存储数据的治理,是维护数据质量、提高决策和管理效率的策略集。其观点也为公共安全数据管理提供了值得思考的角度。

图1 相关概念的内涵界定
总体来看,“数据监管”“数据管理”与“数据治理”的概念是从不同学科视角开展的对数据的探索和研究。三者关注的研究重点不同,同时在研究内容上又存在一定的交叉(见图1)。中国行政管理学会课题组在探讨我国政府数据开放顶层设计研究时指出,政府部门数据资源的深入应用正在催生加强数据资源管理的需求,但是政府部门数据资源管理不完全是一个技术问题,而是兼具技术与管理的双重属性,需要制度安排与技术保障有机配合[37]。与之相应,公共安全数据的管理同样兼具技术与管理双重属性。由于公共安全数据管理活动是一个具有系统性、协同性、复杂性、多元性和动态性的管理活动,公共安全数据管理也是一个具有广泛内涵的概念,指在公共安全治理活动中对公共安全数据本身的管理和相关利益主体的协调,并在此基础上明确管理主体应该实施的管理任务与活动,以及需要运用的管理技术与工具,通过技术支持、标准建设与制度保障等手段共同实现公共安全数据的重用与增值。易言之,本文认为可从三个维度理解公共安全数据管理的内涵:一是从管理客体出发关注数据本身的管理;二是从管理主体出发关注利益相关主体的职责与角色;三是从管理活动出发关注管理主体诉诸管理客体的行动计划。这三个维度相互联系不可分割,共同影响公共安全数据管理的效果。
4 公共安全数据管理的主要内容
4.1 公共安全数据管理的基础理论
目前,关于公共安全数据管理的研究少而零散,需要系统地研究公共安全数据管理的基础理论并构建完整的研究体系,使这一新领域新方向成为数据管理乃至数据科学的重要组成部分,推动数据资源在公共安全治理中发挥重要价值。公共安全数据管理的基础理论研究主要包括以下内容:(1)探讨公共安全数据管理的源起,从数据科学维度和公共安全维度及其联系中寻求逻辑起点;(2)厘清相关概念,对公共安全数据管理的内涵和外延进行界定;(3)明确研究对象,即公共安全活动中的海量多模态数据;(4)探索公共安全数据管理的基本问题,即发现公共安全数据本身的属性、特征和规律,进而从实现数据价值的角度出发,探索如主体、环境、动因、工具等各种管理要素之间的关系和理论框架;(5)分析学科基础,以实现数据科学、信息科学等学科领域知识的迁移和理论支撑;(6)归纳研究手段和方法,根据研究对象的特性构建包含系统分析、情景分析、模型构建等各类研究方法的公共安全数据管理研究方法体系;(7)探索学科定位与发展方向,把握公共安全数据管理的多学科交叉属性,使其成长为具有研究潜力的数据管理分支领域。基础理论研究是构建公共安全数据管理知识体系的基础,也是公共安全数据管理作为一个新领域确立的重要依据。
4.2 公共安全数据管理模型
目前成熟的数据管理模型总体上可分为两大类:一是针对数据本身的管理模型,如“数据生命周期模型”“数据质量评估模型”;二是针对数据管理主体的管理模型,如“机构数据管理基础设施模型”“IBM的数据治理模型”“数据监管能力成熟度模型”等。本文对部分代表性机构提出的数据管理模型进行总结(见表1)。由此可知,相关模型既有从数据全生命周期出发构建的整体性模型,也有针对数据生命周期不同阶段、面向不同数据管理任务所构建的阶段性模型;既有关注科学数据管理的专门性模型,也有适用于不同领域组织机构数据管理的普适性模型。
数据管理模型是促进数据管理策略理念与管理实践相结合的重要理论工具。但目前公共安全数据管理模型的研究仍存在空白,结合公共安全数据的应用情境对其管理模型进行探索是公共安全数据管理的核心内容。面向公共安全数据的管理模型研究需要在已有管理模型的基础上,充分结合公共安全数据的特征和应用情境,提炼其管理过程中的特殊性问题,使公共安全数据管理模型与公共安全治理活动在数据应用目标和管理过程上达成一致,以指导公共安全数据管理的实践。
4.3 公共安全数据管理技术、分析方法与工具
公共安全数据管理是一个系统性的工程,针对不同生命周期阶段的不同管理任务,需要进行管理工具、处理技术与分析方法的集成,通过统一的管理平台提供数据集成、数据建模、数据分析和数据服务的能力,维持并不断改进数据驱动的公共安全治理工作流程。海量多源异构的大数据特征使得公共安全数据的处理技术与分析方法需要深度集成与融合,常见的鬫簅鎋噓处理技术如数据获取技术、数据清洗技术、语义集成技术、存储技术、交换技术、可视化技术、mashups技术等,分析方法如统计分析、网络建模、模拟仿真、机器学习、自然语言处理等。此外,公共安全数据中还涉及大量的传感器数据、视频图像数据等,对多模态数据的语义集成与关联融合是公共安全领域研究和实践中面临的难点,也是亟待深入探索的重点。
开发面向公共安全领域数据的管理工具和平台也需要引起业界足够的重视。除加强Dspace、Dataverse、Fedora等开源通用的数据管理工具在公共安全数据管理中的应用外,面向科研数据管理的专门工具的成功,如由DCC开发的DMPonline和加州大学伯克利分校开发的DMPTool这两个数据管理计划工具在众多高校与科研机构中的成功应用,也表明针对不同领域数据的特征和应用情境构建专业领域的数据管理工具和平台,能够更为灵活地响应领域数据管理需求和目标定位,进行特色应用功能的开发,进而提升领域数据管理的效果和能力。在伦斯勒理工学院的政府开放数据格式转换项目支持下,A Graves集成了纽约特洛伊城警察、消防、医院等多部门的公共安全数据,开发了基于语义网(Semantic Web)的公共安全数据管理平台,该平台能够实现数据的长期保存、数据的可视化展示(如公共安全事件地图)与查询、数据发布和导出等功能[44],在公共安全数据的集成与可视化展示、促进公众参与和第三方应用开发方面取得了显著的成效,其对公共安全数据管理工具与平台开发的思路以及关于数据质量、数据隐私、数据的公布与可发现等问题的探讨和解决经验值得借鉴。
4.4 公共安全数据管理机制建设
表1 代表性机构的数据管理模型

注:①DCC:英国数据监管中心;②SEI:卡内基梅隆大学软件工程研究所;③JISC:英国联合信息系统委员会;④HATII:格拉斯哥大学人文科技信息学院。
公共安全数据管理兼具技术与管理的双重属性,需要制度建设与技术保障的有机配合。提炼公共安全数据全生命周期阶段的内外部管理要素,根据公共安全数据的管理目标与战略决策进行管理机制的建设,核心内容包括政府主体等管理职能的明确、数据生命周期与管理职能集成下支持的数据管理活动与数据服务、公共安全数据管理政策的制定、公共安全数据标准与规范的建立以及机构之间的关联与协同等。其中,统一的公共安全数据规划、协议与标准规范的制定是数据共享与加值的基础,从单一主体管理到多元主体协同与公众参与的转变则是实现全生命周期的整体性数据管理的关键路径,而公共安全数据管理政策的制定和管理活动与数据服务的明晰则是提升公共安全数据管理能力的有力保证。
公共安全数据管理机制的建设,既要重视和完善国家层面的顶层设计,研究公共安全数据管理机制建设中的共性问题和基础问题,也要关注不同安全领域的数据规划和具体管理部门的业务数据剖析,从中微观层面增强相关管理机制的适用性和灵活性。从现有研究与实践发展来看,公共安全数据管理机制需从理论研究和实践应用两个方面进行深入探索,才能支持和推进跨领域、多主体之间的公共安全数据管理与应用。
4.5 公共安全数据的安全管理
公共安全数据作为事关国家安全与社会稳定的重要基础性战略资源,其本身的安全管理至关重要,是数据价值释放与增值的前提和基础。实现公共安全数据的共享利用与安全目标的平衡,需要在技术、人员、组织及管理等多个层面统合下,提供技术应用与管理机制的双重保障。管理机制方面如制定面向公共安全治理活动中多元主体参与的数据安全管理制度、对关键部门与组织进行定期的数据安全状况评估、配置专门的数据安全管理人员等。安全技术方面如加强数据存储与长期保存的物理防护、进行重要数据资源的信息灾备、数据使用过程中的用户访问授权与签名认证、数据流动过程中的加密脱敏和病毒防护等。
从数据安全管理的研究现状来看,数据访问权限的机制与技术、用户信用管理的政策法规与平台技术、基于区块链等新兴技术的数据流动可追溯安全途径、数据安全存储与长期保存的风险评估、公开数据与密级数据的分级分类管理、跨组织边界活动中数据流动的安全风险评估以及数据使用组织安全能力评估等关键问题的研究,将是公共安全数据安全管理的重要内容。
4.6 公共安全数据管理的应用实践
公共安全数据的应用情境和公共安全数据管理实践是明确公共安全数据的定义、类型与特征的逻辑起点,也是明晰公共安全数据管理的内涵与主要内容的基础。通过凝练典型公共安全数据管理经验和总结最佳实践,能够进行基于案例研究的最佳实践策略要素的提取,以支持公共安全数据的研究活动。目前,公共安全数据管理的应用实践主要有两种存在形式,一是不同安全领域的典型案例与数据管理项目,如荷兰司法部的犯罪与司法数据集成项目[45],佛罗里达国际大学的灾害数据管理调研项目[46],我国成都市食品安全监测预警数据中心的食品安全数据汇聚与共享管理项目;二是政府数据开放平台中对“公共安全”数据的发布与共享,不同类型的政府数据开放平台或有专门的“公共安全”主题板块,或是在不同主题板块下分布着与公共安全相关的零散数据集。本文对国内外典型的政府数据开放平台中的“公共安全”数据发布状况进行总结分析(见表2)。
从上述两种方式来看,目前公共安全数据管理实践还未完全实现全生命周期的管理,且缺乏一致的管理框架。尤其以政府数据开放平台为途径的公共安全数据发布共享存在明显的主题交叉、层级混乱和领域不明的问题,缺乏统一的公共安全数据分类标准和数据规范,这一问题也更加凸显了制定统一的公共安全数据管理规划的重要性。
5 公共安全数据管理所提出的新问题
表2 政府数据开放平台中的“公共安全”数据板块分析

注:检索时间为2018年12月11日。
按照夏佩尔的信息域(Domain of information)理论,问题是信息域的核心,信息域中心问题的重新设置是科学进化的主要标志。公共安全数据管理作为一个正在兴起的交叉学科领域,为相关研究与实践提出了新问题。这些问题的提出是公共安全数据管理作为一个新领域确立的重要依据,随着相关实践的发展和理论研究的深入,这些问题会进一步集聚和重组,新的问题也会不断出现,促使公共安全数据管理知识体系的形成和不断进化。
(1)注重公共安全数据管理客体、主体与管理活动的统合。从不同学科领域所开展的与数据相关的研究内容来看,“数据监管”侧重从信息科学和图书档案学角度关注数据的管理活动,“数据管理”侧重从计算机科学角度关注数据的处理技术与分析建模,“数据治理”则侧重从企业管理和行政管理角度关注企业、政府等组织内的数据治理决策与角色定位,同时三种研究视角在数据质量、新技术应用、数据管理平台搭建、数据标准构建等研究内容方面又具有一定程度的交叉重叠。从公共安全治理情境中审视公共安全数据管理,理应具有更广泛的内涵,在理念、制度与技术上形成价值目标的统一。数据管理主客体与管理活动的分离一方面导致数据管理研究中概念与内涵界定混乱,另一方面也不利于全过程、全生命周期的整体性数据管理的实现。因此,公共安全数据管理必须将信息科学、数据科学等相关概念和逻辑向公共安全数据管理领域进行延伸,跨越不同学科领域之间的研究缺口,将公共安全数据管理的主体、客体与管理活动在一致的管理目标与框架下统一起来,促进公共安全数据研究内容的扩展和研究方法的丰富,进而使其管理实践有突破性的进展。
(2)强调政府组织不同层面公共安全数据管理问题的提炼与解决。政府组织是公共安全数据管理的核心主体,从现有政府数据管理研究情况来看,宏观层面的政府数据开放顶层设计与数据治理规划研究较多,而中微观层面的具体数据管理问题缺乏关注。公共安全数据管理,既要关注宏观层面统一管理框架的搭建和规划设计,更要关注中观层面政府对公共安全事务治理过程中多源数据的集成,以及微观层面公共安全管理机构对行政管理过程中产生和使用的业务数据本身的管理。通过解决公共安全数据管理规划、跨部门协同、公共安全数据管理的政策法规、公共安全数据的标准建设、公共安全数据质量管理等不同层面的数据管理问题,构建并完善公共安全数据管理体系与机制。
(3)突出公共安全治理情境中数据的特殊性和数据管理活动的差异性。领域导向的数据管理研究是数据科学的理论方法与领域知识相结合的产物,也是从“数据”这一研究视角关注与探索领域活动规律与特征的新方向。目前,图书馆与高校科研机构等的科学数据管理无论是在理论成果还是实践上成效显著,而政府数据管理研究的领域特征不够明晰,面向某项重大问题或开展某类重要决策需要专门组织开展数据归集活动仍有极大的探索空间,不同政府职能背景下的行业数据管理也缺乏足够的关注。公共安全领域数据的管理需要从宏大的社会数据资源、管理部门业务数据资源以及互联网数据资源等大范围中,根据公共安全活动和治理主体的履职需要锁定其中的关键数据,从关注社会系统数据全集过渡到关注公共安全领域数据子集,发现公共安全领域数据的特殊性和管理活动的差异性,才能制定更具效能的公共安全数据管理策略和机制,帮助推进公共安全数据管理实践的发展和公共安全数据价值的挖掘。
(4)从数据作为关键资产的视角出发促进公共安全数据的增值和数据产品的开发。商业领域将企业数据作为一种战略资产已成为普遍的共识[47]。政府开放数据也被认为是具有赋予公民与企业权力和改变政府提供公共服务方式潜力的重要资源[48]。作为公共安全服务的提供者和公共安全数据管理的主导者,政府管理部门拥有的公共安全数据是其重要的数据资产和战略性基础资源。公共安全数据资产的社会价值与经济价值开发,一方面能够加强数据的内部使用进而更好地支持政府数据开放、提升公共安全服务,另一方面有助于加强与行业企业的合作,促进数据产品的开发和提供协同数据的公共安全服务,创新公共安全治理外部服务形态。公共安全数据的资产价值评估、数据资产定价、相关组织数据资产审计、机构数据资产元数据集构建、数据资产追溯管理等均是学界和实践界需要关注的新问题。
(5)公共安全治理活动中跨组织边界数据流动的安全评估与管控。在“总体国家安全观”指导下,政府管理部门提升公共安全治理能力和治理水平越来越需要应对跨组织边界的公共治理难题和复杂突发公共安全事件。数据作为治理活动的基础性资源,也相应的面临跨组织边界的数据流动,包括组织环境维度的跨境、跨区域和跨领域数据流动,不同组织之间的数据流动以及组织内部的跨层级、跨部门、跨系统数据流动。不同层次的数据流动给政府管理部门带来了全方位的挑战,如跨境数据流动引发的数据管辖权和数据主权问题,跨领域数据流动带来的数据融合与集成问题,不同组织之间的数据外部流转导致的数据质量和安全管理问题,以及组织内部支持数据流动的数据协同与汇集管理问题。但在各种挑战中,公共安全数据本身的安全问题显得尤为重要,且贯穿于不同层次、全生命周期的数据流动过程中。如跨境公共安全数据流动存在的窃取、病毒攻击等安全失控隐患与国家安全和社会稳定密切相关,而组织之间与组织内部的数据流动也容易触发数据的篡改、丢失、滥用、误用等安全问题。加强跨组织边界公共安全数据流动过程中的全周期安全评估与管控,包括数据的导入、脱敏、完整性验证、留存、运用、可视化、外调、销毁等多个环节[49],是保证数据安全和有效共享利用的基础,也是实现平衡多元主体利益的公共安全数据生态的重要保障。
(6)公共安全数据管理的伦理问题与隐私保护。隐私权、信息获取权、信息安全权等与人的信息权利有关的伦理问题[50]是信息时代人们长期关注的焦点,公众对大规模数据收集的担忧也容易引发系列情绪反应[51]。在公共安全治理活动的不同场景中,由于数据生产主体、利用方式、应用目的和涉及利益相关者的差异性,公共安全数据的采集与使用也面临着不同程度的伦理挑战与隐私问题。典型如突发公共安全事件舆情监测中的个人信息保护,人群状态分析与异常行为检测中的地理隐私(Geoprivacy)和算法安全(Algorithmic Security)等问题。美国棱镜门事件就凸显了其公共安全目标与全球民众隐私及互联网自由的冲突,同时也表明“安全”与“隐私”是相互构成相互影响的,应统筹考虑而不是在二者之间权衡利弊[52]。因此,识别公共安全数据全生命周期中的伦理问题并分析相关的形成原因和表现形式,有助于明确数据采集与共享的伦理底线与约束性要求,规范公共安全数据利用行为,既有助于凸显数据的使用价值,又能够促进数据驱动的公共安全治理在伦理可辩护的框架内发展。
6 结语
公共安全数据管理是将数据科学、信息科学等学科的相关理论、概念和逻辑向公共安全领域的延伸,是从公共安全治理活动和情境出发,充分利用现有数据管理的理论成果探索公共安全数据的特殊性和管理活动的差异性,以明确公共安全数据管理中的概念体系、问题范围和分析方法,实现公共安全数据的全要素、全过程、多维度的管理目标。公共安全数据管理作为一个新兴领域,其内涵和知识体系正在发展之中,对公共安全界和数据科学界来说,公共安全数据管理意味着新的挑战、新的方向和新的观念。学界和业界需要站在新一轮信息技术发展的前沿,结合我国公共安全治理的实践需要,推动公共安全数据管理的研究发展与实践创新,使公共安全数据管理成为大数据时代响应总体国家安全观、加强我国公共安全综合能力建设的重要学科支撑和实践力量。
原文参考文献:
[1]徐宗本,冯芷艳,郭迅华,等.大数据驱动的管理与决策前沿课题[J].管理世界,2014(11):158-163.
[2]王芳,慎金花.国外数据管护(Data Curation)研究与实践进展[J].中国图书馆学报,2014,40(4):116-128.
[3]沙勇忠,牛春华,等.信息分析(第二版)[M].北京:科学出版社,2016.
[4]丁翔,张海波.大数据与公共安全:概念、维度与关系[J].中国行政管理,2017(8):36-41.
[5]吴爱明.公共安全:公共管理不可忽视的社会问题[J].行政论坛,2004(6):4-6.
[6]孙粤文.大数据:风险社会公共安全治理的新思维与新技术[J].求实,2016(12):69-77.
[7]陈之常.应用大数据推进政府治理能力现代化——以北京市东城区为例[J].中国行政管理,2015(2):40-44.
[8]Donnelly M,North R.The Milieu and the MESSAGE:Talking to Researchers about Data Curation Issues in a Large and Diverse e-Science Project[J].IJDC,2011,6(1):32-44.
[9]李月,侯卫真.政府大数据应用的多元主体协同策略研究——纽约市案例分析[J].图书情报工作,2017,61(10):50-56.
[10]张春艳.大数据时代的公共安全治理[J].国家行政学院学报,2014(5):100-104.
[11]黄如花,李楠.高校图书馆参与科学数据验证的前景分析[J].图书情报工作,2016,60(3):15-20.
[12]Hey T,Tansley S,Tolle K M.The fourth paradigm:data-intensive scientific discovery[M].Redmond,WA:Microsoft research,2009.
[13]曾子明,杨倩雯.面向第四范式的城市公共安全数据监管体系研究[J].情报理论与实践,2018(2):82-87.
[14]Thakuriah P V,Tilahun N Y,Zellner M.Big data and urban informatics:innovations and challenges to urban planning and knowledge discovery[M].Seeing Cities through Big Data.Springer,Cham,2017:11-45.
[15]Dhar V.Data science and prediction[J].Communications of the ACM,2013,56(12):64-73.
[16]叶鹰,马费成.数据科学兴起及其与信息科学的关联[J].情报学报,2015(6):575-580.
[17]朝乐门,卢小宾.数据科学及其对信息科学的影响[J].情报学报,2017,36(8):761-771.
[18]Mattmann C A.Computing:A vision for data science[J].Nature,2013,493(7433):473.
[19]黄全义,夏金超,杨秀中,等.城市公共安全大数据[J].地理空间信息,2017(7):9,12-19.
[20]Cervone G,Schnebele E,Waters N,et al.Using social media and satellite data for damage assessment in urban areas during emergencies[M].Seeing Cities Through Big Data.Springer,Cham,2017:443-457.
[21]Kaza S,Chen H.Evaluating ontology mapping techniques:An experiment in public safety information sharing[J].Decision Support Systems,2008,45(4):714-728.
[22]Graves A.A case study for integrating public safety data using semantic technologies[J].Information Polity,2011,16(3):261-275.
[23]Choenni S,Leertouwer E.Public safety mashups to support policy makers[C].International Conference on Electronic Government and the Information Systems Perspective.Springer,Berlin,Heidelberg,2010:234-248.
[24]吴金红,陈勇跃.面向科研第四范式的科学数据监管体系研究[J].图书情报工作,2015,59(16):11-17.
[25]Philip Lord,Alison Macdonald,Liz Lyon,et al.From data deluge to data curation[DB/OL].[2019-05-23].http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.111.7425&rep=rep1&type=pdf.
[26]Witt,Michael,et al.Constructing data curation profiles[J].International Journal of Digital Curation,2009,4(3):93-103.
[27]Allcock B,Bester J,Bresnahan J,et al.Data management and transfer in high-performance computational grid environments[J].Parallel Computing,2002,28(5):749-771.
[28]Brakatsoulas S,Pfoser D,Tryfona N.Practical data management techniques for vehicle tracking data[C].Data Engineering,2005.ICDE 2005.Proceedings.21st International Conference on.IEEE,2005:324-325.
[29]Morie J F,Iyer K,Luigi D P,et al.Development of a data management tool for investigating multivariate space and free will experiences in virtual reality[J].Applied Psychophysiology and Biofeedback,2005,30(3):319-331.
[30]Boden T A,Krassovski M,Yang B.The AmeriFlux data activity and data system:an evolving collection of data management techniques,tools,products and services[J].Geoscientific Instrumentation,Methods and Data Systems,2013,2(1):165-176.
[31]Marco D.Understanding data governance and stewardship,Part 1[J].Information Management,2006,16(9):28.
[32]刘桂锋,钱锦琳,卢章平.国内外数据治理研究进展:内涵、要素、模型与框架[J].图书情报工作,2017,61(21):137-144.
[33]Khatri V,Brown C V.Designing data governance[J].Communications of the ACM,2010,53(1):148-152.
[34]顾立平.数据治理——图书馆事业的发展机遇[J].中国图书馆学报,2016,42(5):40-56.
[35]Adrian Gregory.Data Governance—Protecting and Unleashing the Value of Your Customer Data Assets Stage 1:Understanding Data Governance and Your Current Data Management Capability[J].Journal of Direct,Data and Digital Marketing Practice,2011,13(3):40-56.
[36]黄璜.美国联邦政府数据治理:政策与结构[J].中国行政管理,2017(8):47-56.
[37]中国行政管理学会课题组,鲍静,贾凌民,等.我国政府数据开放顶层设计研究[J].中国行政管理,2016(11):6-12.
[38]Higgins S.The DCC curation lifecycle model[J].International Journal of Digital Curation,2008,3(1):134-140.
[39]Wilson J A J,Martinez-Uribe L,Fraser M A,et al.An Institutional Approach to Developing Research Data Management Infrastructure[J].IJDC,2011,6(2):274-287.
[40]Crowston K,Qin J.A capability maturity model for scientific data management:Evidence from the literature[J].Proceedings of the American Society for Information Science and Technology,2011,48(1):1-9.
[41]Jones S,Ball A,Ekmekcioglu
.The Data Audit Framework:a first step in the data management challenge[J].International Journal of Digital Curation,2008,3(2):112-120.
[42]Cox A,Williamson L.The 2014 DAF survey at the University of Sheffield[J].International Journal of Digital Curation,2015,10(1):210-229.
[43]Beagrie N,Chruszcz J,Lavoie B.Keeping research data safe:A cost model and guidance for UK universities[M/OL].[2019-07-18].
http://www.jisc.ac.uk/media/documents/publications/keepingresearchdatasafe0408.pdf.
[44]Graves A.A case study for integrating public safety data using semantic technologies[J].Information Polity,2011,16(3):261-275.
[45]Choenni S,Leertouwer E.Public safety mashups to support policy makers[C].International Conference on Electronic Government and the Information Systems Perspective.Springer,Berlin,Heidelberg,2010:234-248.
[46]Hristidis V,Chen S C,Li T,et al.Survey of data management and analysis in disaster situations[J].Journal of Systems and Software,2010,83(10):1701-1714.
[47]Short J,Todd S.What's Your Data Worth?[J].MIT Sloan Management Review,2017,58(3):17.
[48]Zeleti F A,Ojo A,Curry E.Exploring the economic value of open government data[J].Government Information Quarterly,2016,33(3):535-551.
[49]鲍静,张勇进.政府部门数据治理:一个亟需回应的基本问题[J].中国行政管理,2017(4):30-36.
[50]沙勇忠.国外信息伦理学研究述评[J].大学图书馆学报,2003(5):8-13.
[51]Thompson N,Ravindran R,Nicosia S.Government data does not mean data governance:Lessons learned from a public sector application audit[J].Government Information Quarterly,2015,32(3):316-322.

