
一、问题的提出
我国是首个将数据纳入生产要素范畴的国家,并将数据与土地、劳动力、资本、技术等传统生产要素并列,作为创造经济价值的基础性资源。因此,相较于传统企业理论视角,我们迫切需要辨明数据相较于其他生产要素的学理特质,通过明晰数据如何为企业创造价值、如何转化为企业竞争优势的理论逻辑,指引中国企业更好地利用数据资源,在新一轮科技革命与产业变革中领跑全球。
过去10多年来,我国数字经济和数据产业得到快速发展,以阿里巴巴、腾讯、华为等为代表的数字平台企业,基于庞大数据体量,创造出巨大的经济价值和社会价值,构筑起强大的竞争优势;以海尔、美的、正泰电器、海康威视等为代表的制造业企业,利用数据资源实现技术创新和模式创新,改变了企业价值实现方式;以今日头条、抖音、美团、快手等为代表的互联网“新贵”,更是利用数据要素和数字技术,颠覆了亿万人的社交生活方式、用户消费体验,产生了巨大的数字生态效应。以上事实突显了数据要素的价值性、数据决策的科学性、数据赋能的高效性,表明数据要素已成为助力企业高质量发展的重要动力。可见,将数据明确纳入生产要素并将数据资产入表,是中国企业在数字时代领先全球的重要管理理念和实践。
那么,数据是否必然转化为企业价值?掌握更优数据的企业是否必然获得超越同行的价值回报?从现实情况来看,数据转化为企业价值及其竞争优势的过程,往往蕴含着复杂的条件,存在独特的机制。对截至2025年4月底我国已经开展数据资产入表的100家上市公司的数据分析显示,大部分样本企业没有因为数据资产入表而呈现更好的股价表现,也没有因为在数据层面的持续投资而实现投资绩效的显著提升。其中,首批入表的23家上市公司股价并未出现明显上升,甚至其当期资产回报率出现了下降。由于存在组织设计缺失、标准不一带来的“信息孤岛”、数据质量不高等问题,企业数据要素融通困难,红利释放面临数据快速折旧、数据价值难以评估等的约束。这就给理论研究提出了新的命题——什么样的数据能够为企业创造经济价值、企业在何种条件下可以利用数据构筑起自身竞争优势?在实践中,因为缺乏有效的理论支持,不少企业盲目投资“产业互联网”,急于参与数据生产、数据交易和数据资本化,最终出现大量低效或无效投资。
对数据如何为企业创造经济价值并转化为竞争优势这一管理学基本问题做出理论回应,是中国管理学界独特而重要的理论发展机会。按照经济增长理论,每一次核心生产要素转变的背后,都是“技术—经济”范式的变革,进而带动认知模式和管理范式的跃迁。按照既有的资源基础观,企业资源特性和战略要素市场可以解释企业间的绩效差异,但相较于传统资源,数据具有非竞争性、可复用性、可流动性、使能性、非生产和消费统一性、外部性和虚拟性、非均质性等特征,简单地套用资源基础观已经无法很好解释数据作为一种生产要素如何引致企业绩效差异。为此,我们需要深化对数据的学理认知,明晰数据的本质特征,进而发展新的企业理论来揭示数据的价值创造规律和竞争优势构建规律。概括来说,本文尝试构建的企业数据基础观是对资源基础观的发展,对于深化数据要素化背景下中国企业战略变革和产业政策实践具有直接的启发意义。
二、企业数据资源如何创造价值
在数字经济时代,数据已成为新型生产要素,形态多样的数据已经实实在在地存在于企业生产经营的全过程。因此,我们可以把企业看作数据资源的整合体,进而从资源生成的角度,阐述数据的内涵和形态,厘清不同类型企业如何将数据资源资产化进而价值化的学理逻辑。
(一)何为数据资源
目前文献对“数据”的定义比较多,如国际标准化组织(ISO)将数据定义为信息的一种形式化方式的体现,以达到适合交流、解释或处理的目的。我国《“十四五”数字经济发展规划》提出,数据是数字经济深化发展的核心引擎,能够对提高生产效率发挥乘数作用。中国信息通信研究院将数据界定为对客观事物的数字化记录或描述,是无序的、未经加工处理的原始素材。由于数据具有形态多变的特征,因而常与数字、信息、知识等概念混在一起。我们利用知识管理和信息科学领域经典的DIKW模型来定义数据资源。该模型把“数据”定义为与事件有关的一组离散的、客观的事实描述,是构成信息和知识的原始材料,“信息”是经过处理且有用的数据,“知识”是被处理、组织过的信息,“智慧”则是对事物的深入理解。而“数字”应被归入“使能性技术”或“通用目的技术”范畴,统指那些在各自领域具有普遍使用潜力和技术活力、能够不断迭代改进并引致各类应用场景创新的技术。如果说数据是一种新型生产要素,数字则是技术要素在数字经济时代的延伸。Bellinger等进一步提出,作为原点的数据来自现实世界,不存在与任何规律的联系及理解,只有当数据被加工后,才形成表征数据间逻辑联系的知识。按此逻辑可得出两个结论:第一,原始数据需要被加工为信息、知识后才能创造经济价值。随着被加工程度的深入,数据资源表现出不同的价值水平。第二,不能简单地套用知识基础观、资源基础观来分析企业数据资源,因为数据资源具有与知识以及传统资源不同的加工处理过程和价值创造过程。
本文从价值分析视角,把数据资源的基本特性总结为三个方面。一是原始数据通常体现为弱价值性。这是数据要素难以在场内开展交易的主要原因之一。二是数据资源具有非完全竞争性。由于数据的可流动性,弱化了排他性,再加上数据的高度外部性、可供性和高损耗性,进一步弱化了其竞争性。这与传统资源存在显著差异,传统资源具有稀缺性、弱外部性,更由于明确法律意义上的产权属性,具有显著的竞争性特征。三是数据所有权的非明晰性。数据本身的高流动性、虚拟性、高衰减性和弱排他性,使其所有权界定非常复杂。中共中央、国务院发布的《关于构建数据基础制度更好发挥数据要素作用的意见》只是规定了数据持有权,并没有界定数据所有权,数据生产者难以完全获得数据可能创造的经济价值。这一点显著不同于知识资源,虽然知识资源也存在高流动性,但知识所有权是有法律和制度界定的,可以直接参与知识创造的价值分配。
(二)数据资源创造价值的机理解析
按照资源基础观,企业拥有的品牌、技术知识、熟练劳动力、设备、资金等都可被定义为资源,这些资源在任何条件下都能创造出一定的经济回报。那么,具有上述特性的数据资源,在何种条件下能够为企业创造出持续的、高于行业平均利润的经济价值?这需要打开数据创造价值的过程“黑箱”,在揭示数据资源特性的同时,为分析数据资源构筑竞争优势的内在机理奠定学理基础。
从数据资源形态演变过程来看,起始点是原始数据,经过加工处理后成为中间产品,即数据元件。在现实中,数据元件是指对数据资源进行清洗治理、加工生产而形成的数据产品,具有信息密度大、安全属性强、形态稳定、产权清晰、价值释放效率高等表征。企业通过把数据元件应用于各种场景创造经济价值,这个过程就构成了数据价值链。数据价值链是指企业利用数据资源创造价值的活动过程。经济合作与发展组织(OECD)于2013年提出四环节数据价值链,即数据采集/授权、存储与聚合、分析与销售、利用;美国商务部于2019年提出了五环节数据价值链,即采集、存储、加工、销售和利用。根据数据价值链活动,企业利用数据资源创造价值的过程可分为“数据资产化”和“数据价值化”两个阶段。
第一阶段:数据资产化。这一过程可描述为企业对于那些合法获取的、分散的、碎片化的原始数据,通过合理合规的传输、存储、清洗等行为,将其转化为具有标准化格式、易于为人类和程序访问与分析的结构化数据,最终形成具有预期价值的数据资产。显然,企业以获取多模态、多来源的原始数据,作为数据元件加工过程的起点。企业原始数据主要包括内部业务数据(如供应链、生产过程、客户行为等)、内部数字基础设施(如信息系统、物联网管理系统等)、本地化数据(如员工电脑分散数据等)和外部数据(包括第三方数据公司、公共数据、社交媒体平台等)。企业获取这些数据后,需要部署文件系统、数据仓库、数据湖等存储介质,将原始数据以一定格式保存在物理或逻辑存储介质之中。其间,企业通过衡量数据存储成本和能力,选择自行存储或借助外力存储。接着,在保持原始数据可追溯的前提下,企业对其进行审查和校验,以保证数据一致性。数据清洗之后,形成结构化的数据资源,为后续检索、计算机程序处理与分析提供输入品,最终输出与特定企业应用场景相匹配的数据元件。因此,数据资产化过程就是原始数据向数据元件演变的过程。
第二阶段:数据价值化。这一阶段是企业通过部署数据场景应用和数据流动交易等价值链活动,依托数据评估、数据定价等第三方支持,实现数据产品或服务交易与应用,最终获取经济价值的过程。首先,企业将经过加工和处理的数据元件应用于特定场景。在这个阶段,企业需要进行数字技术、应用流程等互补品的场景化、定制化投入,因为离开了这些互补品,数据产品或服务本身不能独立产生价值。其次,企业需要部署数据交易活动。数据资源创造经济价值具有高度的场景依赖性,标准产品的竞价机制很难确定数据产品或服务的市场价值。在数据资源交易过程中,数据产品或服务的提供方与需求方之间交易的达成,主要依赖于需求方的差异化应用,而这种差异化会使公允价值严重偏离数据资源形成的历史成本,这是造成数据资源场内交易难以达成的根本原因。最后,企业通过数据资本化,获取数据资源投资的利润回报,最终完成数据价值化。
(三)数据资源价值创造的类型化分析
在不同类型的企业中,数据资源的价值创造过程呈现出怎样的差异性?本文将利用数据资源创造价值的企业分为数据原生企业、数据次生企业与数据应用企业,不同类型企业利用数据资源创造价值的过程具有不同的特征。
数据原生企业是指直接把原始数据经过生产、储存、清洗,加工成数据产品或服务,再应用于具体场景的数字企业,如阿里巴巴、腾讯、谷歌、字节跳动等。阿里巴巴是典型的数据原生企业,其庞大的业务体系形成系列“数据烟囱”。曾经一段时期,阿里巴巴集团内部不同业务单元之间数据不协同,导致数据的业务赋能与价值利用效率低下。为此,该企业提出数据中台战略,通过数据基础层汇聚数据,数据中间层清洗数据,数据应用层完成各类数据资产分析,赋能自身业务发展,为个性化场景提供特定的数据资产分析服务、数据资产导航服务等,实现数据价值化。
数据次生企业通常是垂直产业类平台企业,这些企业通过数字技术实现数据基因植入,形成产业互联网形态。数据次生企业类型覆盖各行各业的龙头企业和链主企业,如海康威视、大疆、海尔、吉利等。作为汽车领军企业,吉利搭建了中国首家服务汽车全行业的国家级“双跨”平台——Geega平台,推出了一套以“工业互联网数字化底座+工业领域知识沉淀+平台应用赋能软件”为架构的数字化赋能体系,成为激发行业数据价值、推广引领产业转型的“灯塔”。其中,“数字化底座”是运用物联网、大数据、人工智能等技术构建的数字应用基础设施。依托这一底座,Geega平台将行业内的软硬件服务商的产品数据和设备运行数据、能耗数据、质量控制数据、物流仓储数据等异构数据进行采集和整合,次生企业平台利用边缘计算技术对数据开展清洗、整理等预处理工作。随后,该平台通过网关系统将数据安全稳定地上传至云平台,依托算法、算力将数据沉淀为可规模化复用的数据机理模型,进而开发出一系列可在市场流通交易的数字化解决方案和工业软件(衍生数据),这些解决方案可应用于制造全场景。
数据应用企业是指那些本身并不具有存储、分析和处理等数据生成能力,但能够将集合数据、交易数据、模型化数据等数据产品接入自身需求,应用数据资源创造价值并从中获利的企业。比如,传统银行是典型的数据应用企业,通过与平台企业合作,获取和整合经清洗、结构化处理的不涉密客户的经营数据(包括企业在平台中的交易记录、上下游供应记录、经营信用等),实现金融模式创新,提升融资效率,降低融资风险。再如,不少科技公司凭借强大的数据挖掘、深度学习等技术优势,实现数据化趋势研判、爆款挖掘和供应链组织能力的标准化输出。大量中小企业主要通过应用垂类模型、智能体等数据产品,优化生产管理,实现降本增效。
由图1可知,在应用数据资源创造价值过程中,不同类型企业聚焦于不同的数据价值链环节,创造出不同的价值。数据原生企业的特点是数据获取、加工和应用能力极强,基本覆盖“采集存储—加工分析—场景应用—流通交易”的全价值链环节,完成数据从原始数据到数据元件、再向数据场景嵌入的价值释放过程。数据次生企业建立在数据收集、存储、分析和回嵌应用的基础上,主要集中于“加工分析—场景应用—流通交易”环节,聚焦于对数据元件的深入处理、加工和价值释放。数据应用企业则直接应用数据原生和数据次生企业的数据元件,聚焦于数据的场景化应用,实现数据价值链的全面贯通。以上过程体现了数据资产化和数据价值化的核心逻辑。

综上,企业可视为数据资源的整合体,其利用数据资源创造价值需经过数据资产化、数据价值化两个过程。其中,数据资产化是企业培育有价值的数据资产的过程,数据价值化是企业将数据资源应用于特定场景进而创造经济价值的过程,整个过程构成数据价值链活动。处于不同价值链节点的企业,其价值创造的方式不同,各自利用的数据资源特质也不同,因此利用数据资源创造竞争优势的条件也不完全相同。
三、企业数据资源如何构筑竞争优势
资源基础观认为,企业是人力、物力等资源束的集合,内部资源是企业成长的动力,由此建立“企业资源—企业能力—企业成长”的分析框架,其基本思想是“企业的资源特性和战略要素市场可以解释企业可持续竞争优势和企业间绩效差异”。资源基础观的核心假设是由价值性(Value)、稀缺性(Rarity)、难以模仿性(Inimitability)和可组织性(Organizational)构成的资源分析VRIO模型,即有价值的资源能为企业带来竞争优势;稀缺的、难以模仿的资源能为企业带来短期竞争优势;同时具有VRIO特质的资源可以为企业带来持续的、超越行业平均利润的竞争优势。接下来探讨两个基本问题:第一,哪些因素影响企业数据资源VRIO特征的形成;第二,不同类型企业要利用数据资源构筑竞争优势,需要具备哪些重要条件。
(一)企业数据资源的VRIO特征
第一,数据资源的价值性(V)。数据在原生状态时仅仅是人类对客观事物的数字化记录或描述,并非天生具备使用价值,只有被加工处理,并应用到具体场景时才能创造价值。从数据资源的价值创造机理可以看出,其价值性是建立在数据加工处理等互补能力的基础上,包括数字存储、算力技术、算法模型和其他生产要素创造的互补能力。正因如此,数据资源相较传统资源在价值性维度表现出以下特征。一是强可供性(Affordance),即数据本身所蕴含的、能够支持特定行动或决策的潜在可能性,相较于传统资源更强大。数据资源具有很强的开放性与可塑性,能够在多样化场景中被重新发现和利用,这为企业打开了更广阔的业务空间,范围经济被最大程度地利用。二是强场景适配性,即数据价值的大小在极大程度上取决于其与特定场景的适配性。由于数据资源存在多形态特质,其价值性受技术、劳动力等其他互补要素的影响,不同场景下的价值密度呈现出很强的非均值性,使得同一数据资源在不同场景下所创造的价值往往天差地别。三是强时效性,数据资源会随着时间的推移或拥有者的增多而丧失其部分价值。如在工业互联网领域,生产线实时数据的收集对于供应链的协调布局至关重要,然而数据一旦过期,其价值性就会大大折损。以上三个特征会显著影响企业竞争优势的构筑路径。
第二,数据资源的稀缺性(R)。能够创造价值的数据资源并不一定是数据本身的稀缺,数据资源的稀缺性与场景独特性高度相关。一是数据来源的场景独特性。对于那些在特定时间、特定地点、特定事件下产生的数据,尤其是在极小概率下获取的数据资源往往具有很强的稀缺性,如一架飞机失事时的黑匣子数据、一次特定天文事件的观测记录等。二是数据应用的场景独特性。能够匹配应用到特殊场景的高质量、高相关、可获取数据资源,往往具有很强的稀缺性。例如,能够应用于航空航天、深海作业等极端专业场景的数据资源,其场景嵌入能力只有扎根于该领域的少数企业能够胜任。三是数据资源自生成性带来的场景独特性。数据资源在其利用过程中自动生成的数据,天然具有极强的场景匹配性,在很大程度上可强化数据的稀缺性。例如,在医疗、自动驾驶等领域,获取真实标注数据成本极高且困难,生成性模型可以创建高质量的合成数据,来训练和增强其他人工智能模型。
第三,数据资源的不可模仿性(I)。从自然属性看,原始数据天然地适合共享。由于其虚拟性、非消耗性、非竞争性,数据在共享和交易中不会导致拥有量的减少,使用数据的效用也不会因为使用者数量的增加而下降,使得原始数据常常不具有不可模仿性。但是,现实生活中存在着大量具有特殊背景或涉及个人隐私的高敏感数据(如军工数据、医疗数据等)会被一些专有机制保护起来,呈现出极强的不可模仿性。数据的不可模仿性与数据规模及其质量高度相关,那些基于某一场景长期积累的连续完整数据,需要花费巨大资金、时间、人力投入的高质量数据,也具有极强的不可模仿性与不可替代性。例如,人类基因排序数据,长达十年的国家人口普查数据等。从市场属性看,不少企业不希望数据外溢或供他人利用,往往选择保护其专有数据。例如,那些从事行业垂类整合业务的企业将多年沉淀的经验数据加工封装并动态实时更新,再以数据元件的方式出售,增强数据资源的不可模仿性。因此,相较于传统资源,数据资源的不可模仿性更为复杂。从自然属性看,离散的原始数据易被模仿复制,而特殊数据和规模数据并非如此;从市场属性看,数据资源嵌入社会场景后,因涉及企业战略意图、个人隐私等因素,其不可模仿性大大增加。因此,要从根本上形成不可模仿的数据资源,需要与数字技术、人力资源等互补能力深度嵌入。
第四,数据资源的可组织性(O)。企业是否具备充分利用数据资源的整体组织能力,是进一步决定企业能否利用数据资源构筑持续竞争优势的关键。利用数据资源创造价值的数据原生企业、数据次生企业和数据应用企业处于数据价值链上的不同环节,因此在数据资源的组织性上具备不同的能力条件。数据原生企业由于覆盖数据价值链全部活动,需要完成从原始数据采集存储到交易流通的全部环节,其可组织性表现为能够打通数据价值链上的各个参与者,这就需要具备原始数据规模与质量的基础条件,包括数字技术、算力算法、数据治理等在内的数据加工处理互补能力条件,以及包括数据资源与专有场景深度嵌入的场景化条件。大部分数据次生企业和数据应用企业仅覆盖数据价值链上的部分环节,它们的可组织性主要体现在加工处理数据的互补能力和场景嵌入能力两个方面。
(二)企业利用数据资源构筑持续竞争优势的重要条件
原始数据规模与质量的基础条件、加工处理数据的互补能力条件、场景嵌入能力条件,是数字时代企业利用数据资源构筑竞争优势的三大重要条件(见图2)。

首先,拥有大规模、高质量完整数据的基础条件。数据原生企业通常拥有大规模、高质量的完整数据,以此构筑自身竞争优势,等于赢在了“起跑线”上。数据具有强可供性和强场景匹配性,数据规模越大、质量越高,意味着数据可能匹配和服务的场景就越多、潜在价值也就越高。同时,数据规模大还意味着其内部可能蕴含越多类型和维度的互补数据集,这些数据集之间通过聚合、交叉验证产生溢出效应,基于“高维数据集”进行机器学习训练,就能产生更好的洞察力。例如,由长安汽车、华为和宁德时代共同打造的“阿维塔”,正是集合了三者在整车研发智造、智能汽车解决方案和智慧能源生态领域的数据优势,通过各领域之间的互补性创新,打造更加智能的新能源汽车品牌。进一步地,高质量的完整数据集对于数据原生企业而言,相当于修建了一条“护城河”,其隔离效应能放大数据资源的不可模仿性和不可替代性。此外,数据资源具有特有的网络效应,数据越多就越有可能优化产品或服务,吸引更多参与者贡献数据,由此形成正向循环。例如,高德导航通过获得大量用户行为数据(如实时位置、路径选择等),不断优化算法,为用户提供路线推荐、精准导航、交通状况预判等服务,吸引更多用户使用并贡献行为数据。数据网络效应不会“自然发生”,需要企业获取海量数据突破“冷启动”,但一旦被激活,源源不断的大数据就会涌现并产生“质变”,由数据规模和质量带来的数据资源价值性、稀缺性和不可模仿性就将持续增强,帮助企业更好地构筑自身竞争优势。
其次,具有加工处理数据的互补能力。数据本身不会产生价值,需要将数据加工转化为数据元件,且随加工方式、加工程度的不同而带来不同的价值。按照生产函数来解释,那就是数据资源很难作为独立要素产生价值,而是需要与其他生产要素融合才能释放其价值。因此,不管是哪种类型的企业,想要利用数据资源构筑竞争优势,必须拥有强大的加工处理数据的互补能力。在与其他生产要素融合创造价值的过程中,加工处理数据的互补能力可以决定数据价值释放的大小,在面对相同原始数据时,互补能力越强就越可能将数据加工成有价值的数据元件。这里的互补能力包括算力、算法等数字技术、数据治理能力、新型数智组织能力等,其中数据资源与数字技术能力的耦合最为重要,是将数据“点石成金”的关键。以自动驾驶为例,大部分汽车企业经过数年积累都沉淀出行业海量数据,但不同企业的自动驾驶业务表现出显著的绩效差异,其核心原因就在于智能驾驶体系中的算力和算法差异。例如,感知算法能力决定了道路标志以及人、车辆、石头等障碍物识别结果;控制算法能力决定了加速、紧急刹车等决策指令的输出结果;数据的精准计算能力决定了自动驾驶技术能否占领未来竞争制高点,包括环境感知、精准定位、信息通信、决策与规划、控制与执行等实时分析和海量数据处理能力。
最后,具有数据产品的场景嵌入能力。场景概念在20世纪50年代被提出,后被Kenny等学者引入管理学领域,主要指顾客生活中的特定情境及其引发的需求或情感反应。场景的关键构成要素包括企业提供产品或服务的特定时间、空间与环境及其目标用户、亟待解决的痛点等。可见,应用场景为数据价值的释放提供了特定的场域,处理面向特定场景的数据资源需要企业拥有与之相匹配的场景嵌入能力。越是垂直门类的纵深场景越体现专业性,对企业的场景嵌入能力要求也越高。因此,数据次生企业在场景嵌入能力上需要具备更高水平,但也更有可能成为企业核心竞争力所在。舜智云平台继承全球著名电机与驱控系统制造商卧龙集团近40年的工业制造基因,将卧龙集团在电机生产场景多年积累的专业知识、数字化经验和行业信息等资源,封装成工业互联网平台上的通用模块,以推广复用至整个电机行业及其上下游行业,赋能中小企业创新发展。舜智云工业互联网的电机制造场景嵌入成为数据次生企业的专有性资产,具有非常突出的价值性、稀缺性和不可模仿特征,已构成卧龙集团在垂类行业的核心竞争力。相反,通用电气2012年推出的工业互联网平台Predix在2017年宣告失败,其根源在于业务场景与数据应用的脱节,平台设计过于通用化,数据元件供给无法与业务场景相匹配,不能有效解决行业痛点。
对于不同类型企业,上述三个层次的重要性存在差异。从可组织性视角来看,数据原生企业要利用数据资源构筑竞争优势的条件最为苛刻,需要同时在三个层次具备良好的组织能力,其中数据规模与质量维度最为重要。而数据次生企业和数据应用企业更多需要在后两个层次上具备组织能力。其中,数据次生企业对场景嵌入能力要求更高,而数据应用企业对加工处理数据的互补能力要求更高。
四、新技术经济条件下的企业组织形态
数据资源创造价值的过程是从数据收集、存储、加工到应用的连续过程,需要依赖不同类型企业之间的紧密耦合来实现,进而催生并发展出了新技术经济条件下的企业组织和产业组织形态。数字平台企业依靠大规模、高质量数据,与数据加工处理的互补企业、数据应用企业形成无界合作,导致不同类型企业边界趋于模糊。可以说,随着数据成为新型生产要素,传统的产业组织边界趋向模糊甚至消亡,数据原生企业、数据次生企业和数据应用企业围绕数据价值链成为相互嵌套、互为生态的合作伙伴。图3描绘了数据生态系统的内在关系及其结构。

处于系统底座的数据原生企业,为构筑起上述三个层次的强大实力,需要大规模投入数字基础设施建设,快速增强其数据存储优势和数据聚合优势,吸引数十万甚至百万级数量的参与者参与其主导的数据价值链条。在数据生态系统中,数据原生企业扮演“数据聚合者”功能,并以底座型平台组织形式存在,阿里巴巴、腾讯、字节跳动、亚马逊等是典型代表。例如,阿里云集硬件和软件于一体,凭借自研服务器、高性能运算力、大规模及高效能数据存储能力,能够满足客户对随选存储服务、数据处理及运算、系统解决方案等方面的服务需求,成为全球最大的云计算厂商之一,成功构建起以其为中心的庞大生态系统。数据原生企业打开产业组织边界,以平台化、生态化模式吸引大量数据次生企业、数据应用企业参与价值创造过程。其本质逻辑在于,生态化组织形态能够保证数据网络效应的启动、加速和维持,数据原生企业可由此持续强化所持数据资源的VRIO特征,充分发挥数据可供性优势,通过开放化组织模式,链接多样化应用场景,为千行百业的个性化发展提供系统性服务,也为大量数据次生企业、数据应用企业提供价值共创机会。
数据次生企业在工业互联网中呈现出强大的生命力。它们通常扎根某一纵深行业,以垂直门类平台的组织形态存在,依托具体产业场景扮演“数据开发者”角色,并与底座型平台企业紧密耦合,在数据生态系统中起到“承上启下”的作用。这类企业一方面通过加工处理数据的互补能力,完成对通用性数据价值的深度开发,另一方面通过场景的长期嵌入,完成对数据价值的精准传递,为下游应用企业赋能。例如,在阿里生态系统内,作为服装行业平台组织的数据次生企业知衣科技,依托服装行业最大的结构化数据库,凭借图像识别、数据挖掘、智能推荐等核心技术能力,为服装企业和设计师提供流行趋势预测、设计赋能、款式智能推荐等核心功能,实现对服装产业数字化高效赋能,推动服装产品创新发展。
数据应用企业通常只涉及数据价值链中面向终端应用的价值创造过程,借助底座型平台企业的数据汇集能力和垂直门类平台企业的数据开发能力,在数据生态系统中扮演“数据应用者”角色,多以个体组织形态存在且数量众多。例如,服装企业伊芙丽通过利用阿里平台提供的数字基础设施和数字聚合能力,并与知衣科技垂类次生企业合作,对用户数据进行智能分析和快速决策,初步完成了从面料供应到设计、成衣、再到销售的全面数字化,构建起全链路数字化的运作模式,最终成为每年推出5000款新品、基本实现零库存的“行业奇迹”。
阿里平台、知衣科技、伊芙丽即是围绕同一数据生态相互依存的数据原生企业、数据次生企业和数据应用企业,它们通过“数据聚合者—数据开发者—数据应用者”的分工合作模式,互为生态合作伙伴,形成了数字经济时代的典型产业组织模式。“数据聚合者”通常由处于生态系统内核位置的底座平台型数据原生企业担任,“数据开发者”多由垂直门类平台型数据次生企业担任,“数据应用者”则以海量个体组织形式呈现,依附在底座平台和垂类平台的外围。数据聚合者作为底座平台领导者,吸引着多个垂类平台组织以及海量个体组织依附其上,形成层层嵌套、层层控制关系。在同一生态系统内,底层平台领导者对大量参与者占据主导治理地位,数据生态系统内的全部参与主体都被“数据聚合者”的数据、算法和算力所控制,因为整个系统的基础底座平台取决于其拥有的海量数据、强大算力和精妙算法之间的啮合。
进一步地,由于数据资源呈现出非排他性、可复制性、可流动性等属性特征,合作伙伴之间可通过数据共享更为清晰地了解对方的流程、信用和绩效,有助于缓解信息不对称;实时数据共享有助于提升跨企业的协同效率;区块链等数字技术的运用使得合约执行可追溯,降低了违约风险。由此,数据生态系统通过多元主体耦合、相互依赖、协同创新三大运行机制,推动平台领导者与参与者相互赋能以实现价值创造,系统内各个参与者成为利益共同体。其中,多元主体耦合机制强调吸引更多参与主体加入,实现海量数据汇聚;相互依赖机制强调主体之间的高度战略互补性,防止参与者因平台多栖而造成数据流失;协同创新机制强调通过多主体、多要素、多环节协调,促进数据要素价值的充分释放。概言之,新技术经济条件下的企业大多嵌入在数据生态系统中,处于同一生态系统中的参与者在“数据聚合者”的领导下,通过开放合作、协同创新形成紧密耦合的利益共同体。此时的企业竞争形态不再是企业间的单体竞争,而是以“数据聚合者”为核心构建的数据生态系统间竞争,即“部落集群”间的竞争。
五、企业数据基础观的提出与启示
数据资源的规模化应用始于10余年前,数据被我国正式作为新型生产要素也仅有5年多时间,将数据纳入基础性生产要素的努力才刚刚开始,特别需要针对数据资源特性及其价值创造机理进行深入研究,弥补既有理论的缺口。基于资源基础观,本文在抽象数据资源管理学特性的基础上,重点阐述了数据资源创造价值的理论逻辑,以及企业利用数字资源构筑持续竞争优势的重要条件,探讨了被新的技术经济条件重塑的企业组织和产业组织形态,由此建构起企业数据基础观。数字时代的微观组织作为一个经济主体,可以视为数据资源的整合体,其如何获取加工运用数据、匹配场景应用的能力,关系到整个组织的生存、发展与成功。企业数据基础观通过重点厘清“企业如何利用数据资源创造价值”与“企业如何利用数据资源构筑持续竞争优势”的学理逻辑,深化了数据要素化背景下的中国企业战略变革实践和产业政策设计逻辑。
企业数据基础观是对资源基础观的发展,旨在为数字时代企业利用数据资源创造竞争优势提供理论支撑。基于知识、资源和数据的不同性质,需要发展出与数据特质相契合的企业理论。如果说资源基础观解决的是“知识和信息”没有成为关键生产要素之前的竞争优势构建问题,遵循DIKW模型的逻辑链条,知识基础观往前推进了一步,解决的是知识(包括信息)成为关键生产要素后的竞争优势构建问题,而数据基础观则更往前推进一步,有助于更好解释数据资源如何转化为企业竞争优势的问题。无论是信息经济、知识经济还是技术经济,尚没有“溯源”到数据要素层面。依据DIKW模型的基本架构,如果把信息、知识、智慧表征为数据元件,把数据指代为原始数据,那么,当数据转化为信息、知识和智慧后,就成为一种知识资源,可以用既有的知识基础观解释企业利用知识创造价值和竞争优势的机理。本文以企业原始数据为起点,分析如何将其获取、加工为数据元件,以此实现数据资源的价值创造和竞争优势构筑,系统回答了数据基础观建构的核心问题。
企业数据基础观具有两方面的重要贡献。一方面,通过揭示数据资源的基本特性,明确了数据资源创造价值的理论逻辑,重点回答了“企业如何利用数据创造价值”。区别于劳动力、资本、技术等传统生产要素,数据资源从原始数据形态被加工成数据元件后,才被视为“有价值的资源”,这解决了资源基础观、知识基础观对数据资源如何创造竞争优势解释不足的问题。企业利用数据资源创造价值需要部署数据价值链活动,遵循从数据获取、数据资产形成、数据场景应用,最终实现数据产品/服务/工具交付的过程。数据价值化过程是企业获取的数据资源与其他生产要素交互融合、匹配到应用场景的过程。由此,可得出如下实践启示:(1)正确认识数据资源。企业要避免孤立地看待数据获取和利用,离开应用场景和互补要素,原始数据并不具有独特价值。(2)不能盲目地认为拥有数据就是拥有数据资产。要根据不同类型企业的特点,采用不同的数据资产化和数据价值化战略,开展有效的数据价值分析和流通交易。(3)要把数据创造价值的根本点放在场景化应用上。对于绝大部分数据应用企业来说,应把激活数据价值的重点,放在数据资源与业务场景的融合、数据和其他生产要素的融合上。
另一方面,明晰了数据资源转化为企业竞争优势所需满足的能力条件,且不同类型企业的能力条件具有差异性,重点回答了“企业如何利用数据要素构筑持续竞争优势”。第一,数据原生企业需要在数据规模与质量、加工处理数据的互补能力与场景嵌入能力三个方面均具备良好的组织能力;数据次生企业和数据应用企业需要在加工处理数据的互补能力和场景嵌入能力两个维度具备组织能力;数据规模与质量对数据原生企业最为重要,加工处理数据的互补能力对数据次生企业最为重要,场景嵌入能力对于数据应用企业最为重要。第二,新技术经济条件下的企业嵌入在数据生态系统中,通过“数据聚合者—数据开发者—数据应用者”的分工合作,围绕数据价值链形成相互嵌套、互为生态合作伙伴。组织形态日益呈现出企业边界开放化、组织结构生态化、竞争形态群落化的趋势,企业竞争形态表现为以“数据聚合者”为核心构建的数据生态系统间竞争,即“部落集群”间的竞争。由此,可得出如下实践启示:(1)准确认识数据资源的价值创造规律,企业不要简单化地对原始数据进行投资,也不要简单化地进行数据入表,避免落入数据陷阱。(2)企业利用数据资源构筑竞争优势,必须打通数据资产化和数据价值化的“数据价值链”,这就需要企业联合多元参与主体,共同构筑数据生态系统,打造具有国际竞争力的“部落集群”。(3)正确理解新技术经济条件下的产业组织系统性变革、企业核心竞争力构建的底层逻辑,企业需要从思维模式、组织架构到核心能力进行全方位重塑,以充分激活数据资源潜能,不断构筑竞争新优势。
未来围绕数据基础观的研究可从以下方面作探索推进。第一,进一步完善和拓展数据基础观的理论逻辑。例如,如何从动态视角将数据的即时性、全面性等特征纳入理论框架中;探究数据更新、实时分析等动态竞争力如何作用于新技术经济条件下的企业竞争优势构筑;不同类型企业如何选择不同的数据资源转化路径来创造经济价值;如何通过数据价值链与传统价值链的对比,建构数据价值链理论;等等。第二,运用多样化研究方法开展探索性和验证性研究。比如,围绕企业数据基础观中的数据资源、利用策略和企业绩效之间关系,利用大样本数据开展深入研究和假设验证;对于企业数字创新行为、数据价值创造行为等,将多案例研究和大样本检验相结合,拓展和深化该理论的核心命题。第三,在协同推进数字产业化和产业数字化的背景下,深化数据产业组织结构和行为研究。比如,根据数据生态系统的不同类型,分别从平台企业、周边企业、应用企业,或数据原生企业、数据次生企业、数据应用企业等角度,揭示系统内部不同参与者之间的关系和结构,区分比对不同类型的数据产业组织和数据生态系统。
〔本文注释内容略〕
原文责任编辑:张天悦