当员工离职后,他的数字分身仍在原公司上班;而真正的他,却要在新公司从零开始。这种被戏称为“炼化”的操作已成为当下的热门话题:公司只需将离职员工在职期间产生的音视频、工作数据、文字资产数据输入AI,辅以性格描述,即可训练出一个模仿员工思维与风格的数字分身。这一现象,正引发人们的担忧。近日,多位接受本报记者采访的学者表示,技术狂欢之下,“炼化”正引发人们对个人隐私、劳动价值以及法律边界的深刻追问。
被“克隆”的员工
学者普遍认为,“炼化”作为一种深度加工数据的技术手段,本身具有价值中立性。从企业角度看,它能够实现员工经验与能力的留存和复用,降低对关键人才的依赖,保障服务和业务的连续性。
然而,“数字‘炼化’如果针对特定人员进行经验留存和能力复用,就可能触碰AI伦理问题”。北京大学法学院教授张平对此表示担忧。他认为,对于企业管理、用户咨询服务、数据合规、初级律师、内容审核等经验型岗位而言,由员工数据“炼化”产生的智能模型具有较强替代性,已经在一定程度上影响了相关从业者的生存空间。
更为棘手的是侵权问题。2025年8月,杭州一家企业在未获得完整授权的情况下,利用前员工声音训练AI并用于商业配音,最终被法院认定侵犯声音权益。该案例表明,即便AI生成声音经过技术处理,只要具有可识别性,仍属于自然人声音权益的保护范围。然而,相较于声音、外形、个人信息等已有明确法律依据的权益,思维方式、职业经验等带有鲜明个人色彩的人格特征却处于法律的灰色地带。中国社会科学院法学研究所网络与信息法研究室副主任周辉认为,从知识产权法角度看,法律保护的是思想的表达,而非思想本身。思维作为主观意识活动,难以满足著作权法对于“独创性表达”的客体要求。
“现行法律在认定‘思维产权’侵权时,面临独创性判断困难、侵权比对标准模糊以及责任主体界定不清等问题。”周辉解释道,员工“炼化”生成的表征虽然可能与人类思维模式高度相似,但算法输出本质上仍是统计概率意义上的模式匹配,其创作过程缺乏人类有意识的选择和安排,难以满足著作权法关于智力创造的要求。同时,传统“实质性相似+接触”规则在数据“炼化”场景下也难以适用。模型黑箱特性使接触要件难以证实,而生成内容的随机性与演化性,又使实质性相似的判断失去稳定参照。
从现有民法体系来看,“炼化”并未颠覆侵权法的基本框架,但在因果关系认定方面确有特殊性。中国社会科学院法学研究所民法研究室主任谢鸿飞以医疗领域的生命数字孪生为例解释道:“医生依据数字克隆体的建议作出诊疗决策并导致错误,仍适用民法典过错责任原则,因为医生的注意义务不会因AI介入而减轻;医疗机构和技术厂商则依据产品责任或技术服务合同分担相应风险。”由此可见,“炼化”本质上是对人格要素与职业经验的数字化复用,而非创设新的权利客体。
尽管“思维产权”在权责认定上存在困难,但企业不构成著作权侵权,并不意味着员工权益不会受到侵害。
中国人民大学法学院教授万勇提醒,即使不构成著作权侵权,也不意味着可以任意提取他人的经验特征。在他看来,员工“炼化”过程中的侵权风险不仅存在于输出端,也可能存在于数据采集、复制、抽取、训练和存储等各个环节。如果相关特征来源于保密数据、客户画像、专有数据库或可识别个人信息,仍可能侵犯商业秘密、人格权,甚至构成不正当竞争。
“这一灰色地带最大的风险在于,被提取的经验特征可能被用于重构个人身份、反推训练样本,进而泄露个人信息。”万勇表示,法学界当前最迫切需要讨论的边界,是从他人数据中提炼出的经验特征何时构成对商业秘密、人格利益、市场机会或竞争优势的不当攫取。
警惕技术风险
如今,文化创意、广告营销、新闻传媒及互联网内容生产行业已率先大规模应用数据“炼化”技术。借助AI生成文案、图像、视频等内容,通过模仿特定风格实现海量定向生产。同时,在高端制造、医疗健康、金融风控、智能客服等领域,数字克隆体也得到一定程度的应用。
但与业内公司普遍持欢迎态度不同,公众对于“炼化”行为普遍抱有危机感。有网友尖锐地评论,这种行为“相当于免费萃取了员工的知识产权,是知识圈的圈地运动”,认为应推动建立训练数据权益保护机制,将数据价值返还给真正的数据贡献者。
当技术发展速度快于立法和社会共识形成速度时,学者认为,与其急于全面立法,不如优先厘清技术本身的风险,对不同类型的“炼化”行为进行分类研究,再通过针对性规则逐步填补制度空白。
在周辉看来,“炼化”员工的一个直接风险是造成“模仿停滞”。过度依赖静态模型输出,可能削弱人的批判性思维能力;当模型与社会现实逐渐脱节时,其输出可能持续传播过时的甚至错误的认知,而责任追究又因技术“黑箱”而面临困境。此外,静态模型对既有模式的反复复制,还可能形成“信息茧房”,抑制原创思想产生,削弱社会的创新活力。
相比“模仿停滞”与“创新受阻”,谢鸿飞更深层的担忧则来自宏观层面。他认为,未来如果数据“炼化”与脑机接口技术结合,福柯所说的“生命政治”以及边沁提出的“全景监狱”可能在数字时代被进一步放大。如果公共卫生、应急救助等资源配置越来越依赖算法决策,可能出现所谓“数字赤裸生命”现象,即部分群体因被系统判定风险较高而遭到系统性边缘化,这将与宪法平等原则形成直接冲突。
张平提醒,“炼化”所依赖的训练数据中可能隐含性别、地域和行业等历史偏见,从而导致AI决策不公甚至形成歧视。谢鸿飞认为,除完善侵权责任分配机制外,更应在伦理与法哲学层面确立“算法公平”与“意识数据主权”的底线,确保技术进步不会以牺牲个人自由和社会公正为代价。
在数据“炼化”大潮中,有一部分被“炼化”的原主体已不在世。若利用其风格训练的系统持续牟利,究竟属于技术中立行为,还是构成一种新型剥削?
有学者认为,员工数据“炼化”不仅是知识产权问题,更涉及人格权、个人信息保护和劳动价值分配。特别是在原主体已经离世且缺乏明确知识产权标识的情况下,表面上利用的是风格,实际上却可能复制其声音、肖像、思维方式和表达习惯等人格要素。即便主体已经消亡,未经其生前同意或继承人许可,克隆其人格特征并用于商业获利,本质上仍是在榨取数字痕迹的剩余价值。因此,不宜简单以技术中立概括,而应从技术、法律和行业自治三个维度协同治理。
武汉大学知识产权与竞争法研究所所长宁立志建议,在技术层面,企业应在模型训练前进行数据脱敏和身份剥离,对无法取得许可的数据,特别是涉及已故自然人特征的数据,应予以清除或匿名化处理,并建立可追溯的授权记录。在法律层面,应进一步明确人格要素的商业化利用规则,可将擅自模仿声音、肖像及表达风格等行为纳入人格权保护范围,同时借助反不正当竞争法对“搭便车”式克隆牟利行为进行规制。在行业自治层面,行业协会应制定伦理标准,建立伦理审查机制,禁止未经许可的人格克隆行为。
从事后救济走向全过程预判
网络上流传着这样一则带有黑色幽默色彩的“员工自救方案”:一位互联网从业者为了防止公司恶意“炼化”自己的技能,计划在训练个人模型时悄悄嵌入高深数学解题能力。一旦公司试图复用其AI分身,模型便会自动推演复杂力学方程,大量消耗算力资源。这看似荒诞的对抗方式背后,折射出的是劳动者对于数字“炼化”的深层焦虑。在数字时代,如何最大程度保护个人利益不受侵害,已成为无法回避的问题。
面对数字“炼化”带来的风险,万勇主张由政府主导建立全过程预判框架。“我认为,对数字‘炼化’风险的预判不能等损害发生后再依靠传统侵权法补救,而应采取全过程治理模式,涵盖合法来源审查、输出风险测试、持续监测与投诉处置等环节。”
对此,万勇提出借鉴两类较为成熟的治理经验:一类是算法推荐治理,通过建立算法机制审核、科技伦理审查、安全评估监测等制度,将治理重点前移至系统性风险评估;另一类是深度合成治理,通过强化训练数据管理,对可能引发混淆的生成内容进行显著标识,提升来源、过程和责任主体的可识别性。
落实到数据“炼化”场景,万勇举例,目前至少可以捕捉三类风险信号。其一是数据来源信号,例如批量抓取封闭数据库、绕过技术保护措施、缺乏训练数据摘要或合规记录。其二是输出可逆信号,例如模型在特定提示下能够复现训练样本、泄露个人信息、还原专有数据,或者生成高度可识别的肖像和声音。其三是市场替代信号,即“炼化”产物被集中用于替代特定创作者、机构数据库或经验服务,并以“非表达性特征”为名规避许可、付费与公平竞争。“这些信号都不断提醒学术界,风险干预必须前置到系统性审查和全过程监测之中。”万勇称。
对于经验“炼化”,学术界仍有大量值得深入研究的新课题。张平表示,由于经验“炼化”的边界目前仍较为模糊,“尚无统一标准界定可炼化经验与不可炼化的高阶决策经验”。实践中,往往将从业者全部经验笼统数字化,却忽视了隐私伦理、价值判断、自由裁量和个性化表达等非规则化经验。这些内容无法被数据完整复刻,强行“炼化”极易造成技术应用偏差。
劳动替代的量化指标也长期缺失。一方面,现有研究多停留在定性层面,缺少法律、医疗等专业领域劳动替代比例、岗位结构变化以及职业转型路径的实证数据,导致难以准确判断技术对劳动力市场的真实影响。另一方面,成本效益测算也普遍存在片面化问题。“多数研究仅核算人力和流程成本下降,却忽视数字‘炼化’带来的算法运维成本、合规整改成本、人才培养重塑成本以及纠纷追责等隐性成本。”张平表示,这使得效益评估与产业实际存在明显偏差。
“除此之外,我们对经验固化危害的预防研究明显不足。”张平认为,目前学术界尚未充分讨论经验固化可能导致的行业思维僵化、新生代从业者能力退化以及组织创新能力衰减等深层问题。她呼吁尽快建立可炼化与不可炼化经验的界定标准,开发劳动替代量化评估模型,开展全口径成本效益实证研究,并加强对经验固化长期影响的预防性研究。
AI代表着科技发展的新土壤,催生了新的产业形态。学术研究既离不开实践土壤,也应服务于实践发展。宁立志表示,研究过程中应始终警惕技术异化,避免过度推崇工具理性,坚持技术发展与公共利益相平衡,防止以效率之名牺牲人的主体价值。同时,应保持法律制度的稳定性。面对AI带来的新问题,应优先通过解释和适用著作权法、个人信息保护法、反不正当竞争法、劳动法等现有制度加以回应,不宜急于创设新的权利义务体系,以避免规范碎片化和制度过度复杂化。
数字“炼化”将人的经验、思维与人格编码作为可无限复制的数据资源,却也可能使劳动者陷入“我非我”的权利困境,而现行法律对于相关权益的归属与保护仍存在空白。但无论技术如何发展,人工智能产业和服务都应坚持“以人为本、智能向善,尊重和保障人格尊严”的基本原则。这一原则不应仅停留于理念层面,而应落实到数据采集、模型训练和算法应用的具体制度之中。正如学者所警示的,在效率之外,人始终应是目的而非手段。唯有如此,数字分身才不会成为劳动者的“第二座围城”。
中国社会科学报记者 张译心