数据持有者的权利配置——数据产权结构性分置的法律实现
高富平,华诚所高级合伙人、华东政法大学法律学院教授、华东政法大学数据法律研究中心主任
摘 要
数据是社会资源,任何数据产权配置必须保持数据开放性或可获取性。本文提出了数据来源者、数据持有者与数据使用者利益的协同,基于利益界定而非客体界定的权利配置框架。数据持有权是对数据事实状态的承认,但持有者配置以什么权利需要依赖其对数据加工使用形成的数据形态和价值配置不同的权利。数据产品化(价值实现)是一个过程,因而数据权利配置是动态的。这一过程中的数据可区分为作为要素的数据资源和作为产出物的数据产品。数据要素的价值在于可不断汇集满足不同计算分析目的,确认持有者的流通权即可以实现其价值;而一旦形成形态和价值相对固定的数据产品,则需要给数据持有者配置稳定具有一定排他性的产权。只有形态和价值相对固定的数据产品的持有权才具有产权分置条件,即数据产品持有者授权形成分权体系,而在要素化阶段,数据产权的结构性分置体现为对其各自加工使用结果的独立分享——相互独立的数据要素持有权(流通数据使用权)。这是符合数据要素特征最大化实现数据社会价值的一种制度安排。这样的制度安排需要对数据流通行为的法律规范,以创制合规高效利用数据资源的治理框架。
关键词
数据持有者权;数据要素;数据产品;数据流通;结构性分置
一、引言
“知识就是力量”正逐渐被“数据就是力量”所取代,因为数据可以产生智能和新知,赋能社会经济发展。中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称《数据二十条》)提出“建立公共数据、企业数据、个人数据的分类分级确权授权制度”,再次引发人们对数据确权的探讨,甚至深圳率先制定办法,探索通过数据登记实现确权的路径。〔1〕从字面理解,确权是确认权利的归属,即确认某项财产权利归属于某个特定主体。不过,确权需要通过具体的法律机制来实现,最终要落实为具体的法律制度。因而,我们应当在具体的法律制度中理解其含义。确权可以通过诉讼程序实现,最典型的为确权之诉。显然,它是在两个主体对同一财产的权利归属发生争议时,法院依据争议主体所提交的事实(证据)和法律规则来审核和裁判权归谁享有。这样的确权是确认权利归属,而不是《数据二十条》中“确立某类主体对特定数据享有什么权利”意义上的确权。这样的数据确权应理解为数据权利的初始配置。至于授权,只是在法律明确初始权利,数据权利人的权利处分或行使问题。法律需要做的是如何规范权力行使,防范数据权利人滥用权利。因此,初始权利配置才是法律上的数据确权。
在初始权利配置方面,《数据二十条》的核心思想是:“根据数据来源和数据生成特征,分别界定数据生产、流通、使用过程中各参与方享有的合法权利,建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制”。这一思想也被概括为淡化所有权、强调使用权,聚焦数据使用权流通的“三权分置”的数据产权制度框架。〔2〕笔者将这一框架总结为“数据资源持有权+数据使用权流通交易”模式。这是适应数据特征的制度创新,是对传统权利制度框架的突破。问题的核心在于如何将这一框架纳入现行法律以构建数据资源持有权体系,尤其是如何理解数据产权的结构性产权分置。
在物仅能为单一主体使用的物权体制下存在保留原权,创设出某种物权性权利的制度安排。典型地,所有权人可以放弃物占有使用而为他人创设使用权或经营权,来源于农地制度改革,解决以身份为基础的家庭承包经营带来的规模化经营的特殊问题的“三权分置”并非传统产权的普遍范式。〔3〕数据可复制或可分享特征决定了不需要援用传统产权分置理论实现同一数据的多重或多主体利用。最为重要的是,数据与一般物权客体不同,其具有非排他性和非竞争性,而现有产权制度安排恰恰是以单一主体对特定客体(财产)排他控制和使用为基础的,因而赋予单一主体排他支配权被认为是最有效的资源配置和利用方式。有效配置数据资源的关键是如何理解和设计数据持有权,以体现数据产权结构性分置的目标和理念,形成有利于数据价值最大化实现的数据基础制度。
本文认为,《数据二十条》所提出的数据持有权是契合数据要素特征的一种新产权范式〔4〕,而所谓的结构性分置是对数据持有权体系化的设想,我们需要从数据初始权利配置的角度,设计体现分置思想的数据持有权体系。数据持有者应当覆盖数据价值实现过程中的不同数据形态,不同主体基于其加工处理而享有权利。为了分析需要,本文将数据划分为原始形态的数据资源(或称“数据要素”)和数据加工使用的产出物——数据产品。数据产品本质上是数据价值的最终实现,严格地讲,数据产品将不再属于数据范畴,而是可直接应用于社会经济中的智能工具或辅助决策的知识或信息。数据要素市场建设的核心逻辑是:通过数据资源的流通利用促进数据产品的生产,通过数据产品的交易带动数据要素化或产品化的利用。在治理范式下,数据产权不是单一主体对特定数据的支配权,而是服务于数据社会价值实现的权益安排,它需要适当的产权运行机制来实现,更需要对数据社会化利用行为加以规范。
二、数据产权配置理论:来源者、持有者和使用者权益协同
是可获取和利用的;凡是可以通过爬虫等技术抓取的,都是合法可用的。这样的数据利用秩序并不具有正当性,我们需要识别数据上存在的合法正当权益,从而明确数据权利初始配置的方向。因此,数据产权本质上是调整主体与主体之间关于数据使用的利益关系的制度。〔6〕笔者认为,在承认数据是社会可用资源的背景下,社会中每个主体都可能是数据来源者、使用者和生产者三重角色。为了构建数据流通利用秩序,需要在这三重角色中选择一个作为初始权利配置主体,同时兼顾另外两个角色的利益。基于数据使用创造价值的理念,笔者认为应当优先保护价值创造者,赋予创造数据价值的加工使用者(或称“数据持有者”)以初始权利;同时,持有者既要保护数据来源者的合法利益,同时也不应妨碍在后使用者获取和使用数据。这便是数据权利配置的理论基础。
获取利用数据的权利既关系人类认知和探索未知自由,又是社会组织和活动得到开展的前提,是人类文明进步的基础,因而应当作为一项基本权利——数据使用权,得到宪法的优先保护。数据是客观世界的映射,是关于客观对象的描述,是认知客观世界的媒介。为了开展各项社会活动,每个社会主体均需要获取关于客观世界的数据,来认知客观世界,改造客观世界。当我们探索自然和社会的客观规律、认识交往每个对象《(个人或组织)时,均要获得关于这些对象的各种数据,甚至人类社会的发展和运行均是建立在自由获取和使用数据的基础上。因此,我们需要确认每个社会主体均有获取和利用数据从事社会活动的权利,以保护社会主体的认知、探索自由,使各项社会活动得以开展,最终实现创造社会进步和福祉的目标。事实上,人类社会对事实数据的使用一直保持开放的态度,既允许各社会主体获取关于各主体的数据、各主体生成或制作且已经公开的数据,也没有赋予来源者控制数据,制止他人获取和使用的权利。因此,保护数据使用权是数据基础制度构建的基本出发点,其本质上则是实现来源者、持有者与使用者三者利益的平衡来实现。
(一)来源者与持有者利益的平衡
数据来源于社会主体的活动,当数据描述对象涉及需要保护的主体利益时,就存在需要保护的利益。所谓来源者就是数据描述、映射或关联的对象(主体)。〔7〕每个社会主体在从事或参与各种社会活动中都会主动生成或参与生成各种数据,或者被各种传感设备记录下各种数据。当数据关联到某个主体或者由某主体创制时,就需要考量来源者是否存在需要保护的利益。
从世界各国的数据立法进程来看,来源者与持有者的利益平衡是最先被考量的价值因素,其中最为典型的表现就是个人信息保护立法运动。在这方面,源自域外的个人信息保护制度为我们提供了来源者利益保护的基本规则。因为个人是主体(或被称为“信息主体”或“数据主体”),所以当数据与某个人关联或者可以用于认知某个主体特征时,处理数据时不能像对待一般客体那样随意处理,而必须尊重和保护个人主体权益。这样的主体权利,在欧洲被称为个人数据受保护权,在我国称为“个人信息权益”。〔8〕个人信息权益不是个人信息权或个人信息支配权,个人并没有个人信息的使用决定权,《个人信息保护法》也没有建立非经同意不得使用个人信息的财产规则。〔9〕个人信息保护本质上体现为通过个人在个人信息处理中的权利来防范个人尊严、自由或平等利益因信息处理而受到侵犯。〔10〕显然,在产生世界性影响的“欧盟个人信息保护模式”中,作为来源者的个人拥有了比持有者更加优先地受到法律保护的价值。也正是为了实现这一目的,在数据产权的讨论中,来源者利益也当然地被视为数据“产权化”的前置性条件。
因此,对于持有者来说,成立数据持有者的条件之一就是必须确保其持有数据的来源合法。在现行法律规范体系的框架之下,就是要求持有者已经妥善处理了与数据来源者的利益冲突问题,即满足了诸如《网络安全法》《个人信息保护法》《反不正当竞争法》《著作权法》等法律规范对于数据来源者相关合法利益保护的要求。只有满足这样的合法性要求,持有者后续的使用或是分享数据的行为才不会受到来自数据来源者的阻碍。由此可见,来源者利益与持有者利益的“较量”一直都是数据产权配置过程中的主要矛盾,以至于有很多学者甚至提出为作为数据来源者的数据主体直接配置所谓的“所有权”,〔11〕以彰显对于数据来源者利益的重视。而在笔者看来,赋予数据来源者一种消极防御的权利,并要求持有者积极履行相应的来源者利益保护义务足以实现对数据上来源者合法利益的保护,同时也是一种更为经济的数据产权配置理论。
(二)来源者与使用者利益的平衡
如前所述,除了关联到个人外,大量的数据还描述物或事件,当物有所有者或使用者时,或者当事件关联个人时,仍然存在是否要保护物的所有者、使用者或事件涉及的个人利益问题。比如,智能汽车不仅可以采集发动机、汽油消耗等记录,还可以采集操控、刹车、行驶路线、停泊位置等信息。显然,来源于汽车的数据也存在是否要保护车主或使用者利益的问题。〔12〕除纯粹描述水文、地质、天气等无主物体的数据不需要考虑来源者利益外,大多数情形下的数据采集和使用都需要考虑可能涉及的主体利益。尤其当我们用所收集的数据去观察某个对象的特征或规律时,需要考虑数据的描述主体或分析对象是否存在需要保护的利益。
实际上,消极保护来源者可能的权益亦适用于一切物主利益或组织利益。《数据二十条》认为要承认由来源者“促成所产生数据的权利”,但是并未提出赋予来源者对数据的专有权,仍然采取“基于知情同意或存在法定事由的数据流通使用模式”。当这些主体具有合法的利益需要保护时,法律就会介入以规范数据使用行为,向数据使用者施加保护数据上合法利益的义务。除此之外,数据的获取和使用应当是自由的、不受限制的。这样的制度安排的效果是:既让各社会主体获取数据,又规范了其使用行为,以避免对来源者利益侵害;既保护来源者权益,又不能让来源者完全控制数据的使用,妨碍知识探索和社会活动开展。由此在平衡来源者利益和使用者利益的基础上,又使数据成为社会可用资源,促进了社会共同利益达成,是人类社会最优的制度安排。
因此,如果说前述来源者与持有者利益的平衡是具象的利益平衡,那么来源者与使用者的利益平衡则属于抽象层面的利益平衡,因为后者更多关注人权层面的信息自由的利益考量。个人信息权益与信息自由的平衡一直都是数据立法的重要平衡点,在《欧盟统一数据保护条例》的鉴于条款中也一直强调,即使是个人信息,也应当在“高保护水平之下,在欧盟范围内以及与第三方国家、国际组织之间自由流通”。其制度初衷也是主要是为了平衡作为数据来源者的个人信息利益与数据使用者抽象的获取信息与数据的人权利益。当然,在具体的数据流通场景中,一般性的数据使用者也往往通过成为具体的数据持有者来实现具体的数据使用利益,从而落入来源者与持有者的利益平衡测试当中,但至少从数据权利配置的角度,我们依然需要考量这样的抽象利益的保护问题,因为不论传统财产权还是数据产权,其最为重要的制度价值之一就是要促进共同的“人类繁荣”。〔13〕
(三)持有者与使用者利益的平衡
数据被采集、加工处理、分析而成为有价值的生产要素,而在这一过程中总是为不同的主体所持有,这些主体被称为数据持有者。由于各主体触达其他个体的机会不平等,获取数据的能力也不平等,如果在先获取者或者有强大获取能力的主体可持久控制数据或排他支配数据,也会妨碍其他社会主体获取数据。因而数据初始权利配置还必须考虑在先数据获取者妨碍其他主体获取和使用数据的问题。在承认数据获取、控制、使用者应当配置以权利前提下,我们还需要防范持有者对数据的绝对或排他控制,导致将数据纳入单一主体排他支配权体系的后果。
在这方面,数据持有者权利的配置就需要避免采用物权初始权利配置规则,即先占或加工使用而取得排他性数据产权。“先占取得所有权”和“劳动取得劳动成果的所有权”不能作为数据持有者权利配置的基础,否则,数据在先使用者会妨碍在后使用者获取数据权利。〔14〕在这种情形下,获得在先数据持有者的让与或授权成为在后的数据使用者获得和使用数据的唯一途径。这样即置具有社会性、公共性的数据资源于个人意志之下,成为市场交易的对象。这既不符合数据社会共同资源属性,也与数据本身的性质不相吻合。数据使用具有非竞争性和可分享性,数据是在不断流通利用中实现其价值的社会资源,赋予任何单一主体长期稳定的产权,〔15〕保护其对数据的支配利益既不必要,也不利于数据价值的实现,还会妨碍其他主体获取数据,认知和改造客观世界。
这意味着,对于数据持有者权利保护是以保护其创造的价值及其在数据上利益目的,而不是保护其对数据的支配权。也就是说,数据持有者所享有的权利仅限于保护其对数据改进、完善等添附行为所创造的价值,而不是长久支配数据;允许其流通数据既可以实现其创造的价值,又可以满足在后使用者对数据获取和使用的需求。数据持有者的权利,不应当简单地理解为物权法原理下的占有权,而是持有者合法利益的保护权。
承认数据的合法持有者具有使用和流通数据的权利,才能开启流通利用或社会化利用秩序,同时也能实现加工使用的价值。只是给予持有者的权利应当与持有者在数据上创造的价值或需要保护的利益相称。赋予持有者有限的使用和流通数据的权利,在激励采集、加工处理不断地改变数据可用性及使用价值的同时,维系数据资源的社会性、开放性。数据持有者权本质上依附于使用,而非持有、来源或归属。〔16〕
因此,数据初始权利配置必须考虑每个社会主体的三重角色,赋予数据持有者加工使用数据、实现其价值有限权利;在激励数据生产(或治理)的同时,促进数据流通利用,保持数据可获取性,保护其他主体的数据使用权;此外,还要给持有者施加保护来源者利益的义务,以保护数据相关主体的利益不会因数据的社会化利用而受侵犯。这样的数据初始权利配置已经不是“持有者有权(自由),非持有者无权(不自由)”的传统产权逻辑范式,而是基于数据利用行为规范的持有者权利、义务、责任为一体的治理范式。这样的治理范式不是通过赋权与限权的法律规范来实现,而是通过适合数据特征的产权运行机制来实现。
三、适合数据特征的产权运行机制
在数据产权方面,《数据二十条》指导思想是“根据数据来源和数据生成特征”构建“分置的产权运行机制”。显然,数据产权运行机制是前述权利配置理论在数据价值实现的经济活动(数据生产、流通、使用过程)中的具体化,是最大化实现数据价值的制度安排。所谓“三权分置”应理解为一种思想理念或探索〔17〕,而不是既定法律制度。数据持有者权利在数据生产、流通和使用过程中的配置,还应当从数据资源特征出发,寻找既适合数据特征,又符合法律逻辑的法律表达。
(一)适合分享的数据产权制度
上述数据产权配置理论表明,数据持有者本身并不享有归属、支配意义上的数据产权,更不允许持有者排他、长久地决定和获取使用利益。也就是在初始权利配置时避免适用物权法原理,当然也意味着在权利实现机制上不能适用物权法体系中的产权分置架构。
数据不同于有形物,其本身价值较小,即使是治理好的可用数据集其价值也不固定,只有在多场景应用中才能发挥价值。数据需要经过一系列的加工处理和分析应用才能最终转化为生产力,才产生经济价值。这一过程被称为数据要素化或数据产品化,成为可以支撑内部决策或者对外提供的可用或可重用数据。〔18〕“数据生产要素化是利用数字技术对原始数据进行加工并嵌入生产活动,转化为数据生产力的系列过程,是数据的物化劳动过程,能够与传统生产要素产生新的组合方式。”〔19〕数据作为新的生产要素,对其他要素的效率具有乘数效应〔20〕,数据要素价值创造是在数据流动中实现的,其实现方式分为集聚型、融合型和协同型三种方式。〔21〕数据要素投入到生产的途径可分为三次价值释放过程,即数据支撑业务贯通、数据推动数智决策、数据流通对外赋能。〔22〕数据要素通过叠加到土地、劳动力、资本、技术等其他生产要素中发挥作用,提高其他要素本身的价值和配置效率。数据要素具有放 大、叠加、倍增作用,赋能传统产业转型升级、催生新产业新业态新模式、提高全要素生产率。〔23〕数据要素及其价值实现的这些特征说明,数据是在流通利用中成为生产要素,而不是其本身具有经济价值,因而适合数据特征的产权制度应当从静态归属转向动态利用,从排他支配转向分享利用。〔24〕
数据的控制和使用本身具有非排他性,数据持有者可以在相同时间将相同的数据分享给多个主体共同使用,而且这样共享并不实质影响持有者或其他使用人实现数据的使用价值,数据这一特性与传统物权法的分权理论存在冲突。以物权归属为基础的产权体系支撑了两种资源社会化利用方式:一是凭借清晰界定的产权归属和基于权利公示的权利推定规则,建立市场化的产权交易,实现资源的有效配置和利用;二是在保留所有权的前提下,创设他物权人,实现不同主体对相同客体不同价值的享有或对相同权利不同效力或时序的享有。后者属于他物权设定行为,俗称为“产权分置”。〔25〕传统物权法的分权理论是适用于物只为一人所有和排他性使用的情形下,是母权利派生出子权利的制度安排,不同主体享有不同效力或不同时序的权利。但这样的安排并不适合于数据资源,这主要是因为数据价值具有多样性,在不同的领域、不同场景、不同的使用目的具有不同的价值。此外,数据的价值还具有多时序性,在不同的时间段有不同的价值。本质上,数据本身不存在固定不变的价值,而是在不断地使用中创造价值的,如果这样的价值创造并不实质影响前手或其他使用者利益时,我们就应当以数据流通利用过程中的价值创造行为为基础来配置“产权”。数据权利配置的基础不是对数据的“拥有”,而是对数据上产生的价值的享有。由于数据本身是可分享的,但基于各自价值创造而控制数据符合每个数据使用者的期望。只要具有各自价值基础,不同的加工使用者就可以在相同或相似数据上形成各自独立的数据权利。这样的赋权以价值或利益识别为基础,忽略了对权利客体的界定。〔26〕换言之,数据权利配置的现实选择是从利益界定权利,而非从客体界定权利。
这一理论可以概括为针对相同或相似来源数据基于各自价值创造各自享有的独立权利。这样的“产权”安排可以切断数据持有者对后续使用者对数据的支配效力,使每个合法取得(包括流通交易)数据的使用者成为独立数据持有者,享有独立数据使用权,最大化地促进数据的社会化流通利用。
数据初始权利配置一开始就可以采取分享产权模式,这样就不存在单一控制下分权的必要。数据本身并不存在像物之所有权一样的母权利,因而很难适用传统的分权理论创设多元数据权利。〔27〕一旦允许持有者分权,那么势必强化数据持有者对数据重用的持久控制,反而变相地赋予其所有者地位。一旦获取数据存在单一源头或权利人,只有通过分权或交易才能获取数据,生产知识或智能决策,那么就会妨碍获取数据的认知或探索行为。针对数据资源的重用秩序,我们应当基于数据非排他使用且各自创造独立的价值而赋予每个数据使用者以独立权利,从而最大化地实现数据的价值。这也就是说,分享模式下的数据初始权利配置决定了不基于单一权利的产权分置。数据作为一种社会资源,应当由不同主体分享数据上利益,而不是在单一权利下进行产权分置,我们应当超越传统产权范式的窠臼,设计实现数据上各自利益的分立数据产权运行机制。
(二)数据持有者权:基于加工使用享有不同形态的数据产权
在分享理念下,数据持有权就演绎为基于加工处理或治理劳动而对不同形态的数据享有的使用权。这是承认数据是经过加工处理而成为生产要素,是在不断地加工使用中实现价值的判断之下必然得出的一个结论。由此数据资源持有者权是对数据资源事实控制现状的承认和保护,从而流通其生产的数据;对不同阶段加工使用行为配置以权利,以鼓励价值创造,实现数据的价值。如果把数据资源转化为不同形态的可用数据或有价值数据的过程称为数据产品化〔28〕,那么在流通利用过程中就会形成不断更迭的数据产品持有权。为此,我们需要构建抽象的数据持有权概念,再根据所持有数据的状态配置具体的权利,以形成具体的数据持有权。
在抽象概念上,数据持有权是数据持有者权利的简称,可以定义为依法获取数据的持有者对合法取得和控制的数据享有的使用、流通和收益的权利。其中使用指持有者自己使用,如加工处理、分析利用;流通则指将加工使用形成的数据产品提供给他人使用,而收益则是指因使用和流通数据获取回报或对价。显然,使用是持有者权利的核心,这不仅是因为获得和控制数据的目的即是使用,也是因为数据因使用而产生价值。这里的使用是指对数据的生产性加工处理,是改进或创造价值的数据处理行为。因此,加工使用涵盖了从数据清洗、标注、完善、组合、集成,再到对数据进行剖析分析(Data Profiling)和挖掘分析(Data Mining)等融合计算分析,最终形成知识或数据产品的一系列数据产品化行为。这样的使用在《数据二十条》表达为数据“加工使用”,即创造价值的数据使用行为,笔者曾将之表述为数据生产行为〔29〕。显然,数据加工使用权不能作为资产性权益,〔30〕应承认和保护数据加工处理者
通过合法或授权等方式所享有的数据持有、使用、许可使用的权利。〔31〕在笔者看来,数据加工使用权不是独立存在的权利,而是依附于数据的权利,是合法的数据持有者加工使用数据和享用加工使用形成的数据的权利。当数据因“加工使用”转变为数据产品时,数据资源持有权就演进为数据产品持有权。数据产品持有权是数据资源因加工使用形态变化的自然结果,是对数据加工使用的最好保护。
由于数据使用是在不同场景服务于特定用途或目的的,因而数据流通本质上是将数据加工成为适用不同场景的“特定数据”,形成分属不同主体控制和使用的数据。因此,我们应当为在特定场景中加工使用者“赋权”,确认不同应用场景下的数据加工使用者享有数据产品持有权。〔32〕从持有者的角度,如果提供数据给他人使用能够获得对价,那么流通也是实现其数据价值的方式;从社会的角度,数据流通既给了接受者在特定场景中加工使用的权利,又创造了价值。当数据资源持有者将数据提供给他人使用时,不管数据资源持有者采取让与数据还是许可使用的方式,接受者均可以对数据进行加工使用。在笔者看来,《数据二十条》提出的数据加工使用权旨在承认和保护因合法流通形成的加工使用权,它应当是数据流通的目的和内容,对数据加工使用权的保护最有效方式是确立数据加工使用者取得加工形成的数据产品的持有权。这意味着,数据接受者因加工使用再次成为数据(产品)持有者,享有使用、流通和收益数据 (产品)的权利。
从广泛意义上,数据产品只是一个比喻,用来涵盖数据从不可用到可用或好用的数据集,再到形成生产力的知识或智能工具的转化过程中的任何数据改进形态或产出物。目前从法律角度谈及数据产品保护多基于杭州互联网法院在从淘宝公司与美景公司不正当竞争纠纷案中将“生意参谋”认定数据产品〔33〕展开定义的,多强调对原始数据的加工处理形成具有独立于原始数据的衍生数据。〔34〕但是,从交易的角度,凡是可以分享、交换和重用的对象,就需要视为“商品”,确定其价格,因而数据集本身作为产品(Data Sets As Products),〔35〕可交易的数据产品被理解为数据集或者从数据集中衍生出的信息服务。〔36〕的确,在广义上,只要加工处理改变或添附新价值,都可以形成可交易数据,但为了更清晰地描述数据转化为生产力的经济过程,笔者将其分两个阶段,仅将后一个阶段的产出物称为数据产品。
数据价值实现的第一阶段是对数据资源进行加工使用或深度治理形成可界定、可流通、可重用的原始数据集。可交易数据集虽然具备产品属性,甚至也有结构或模型,但使用价值体现在数据本身的可关联性、可聚合性和可编辑性,不存在固定的形态和价值,只有经过计算分析,才能最终形成赋能社会的消费品,如算法模型、智能工具、知识结论、分析预测等数据产品。前一阶段生产了可重用的数据集,数据集的流通则为数据产品的生产提供原材料,即生产智能或知识的要素。如果将这两个过程看作一个整体,那么只有原始数据生产出的数据产品才算是数据产品。〔37〕这样的数据产品才可以转化为生产力,赋能实体经济,也才能按照其应用产生的经济效益评估其价值。相反,作为原材料的数据集或数据要素,在未置于具体应用场景或流通交易情形下,将很难评估其经济价值。数据是在不断变换场景的流通利用中产生价值和实现价值的,而在这一过程中数据本身不断变换形态、呈现不同的价值。具体而言,由原始数据的计算价值,逐渐转变为工具、知识内容价值,由不断汇集利用不固定形态,到形成价值和形成固定形态,因而我们应基于数据价值形成过程来分别确权,将数据持有权覆盖到从数据资源到最终产出物中各种形态的有价值、可重用数据。显然,数据产品化不是一个点,而是一个过程,在这一过程中均需要确权,激励原始数据的治理和流通,以生产出更多的智能成果。〔38〕不管我们是否将数据资源治理形成的可重用数据(集)称为数据产品,数据资源(数据要素,二者可互换使用)和最终的数据产品位于数据产品化的两端,我们不妨将之分别称为数据资源持有者权和数据产品持有者权。持有者权制度旨在保护数据产品化过程的努力和贡献,是对加工处理行为的认。
(三)数据持有者权“结构性分置”的实现
数据持有者权就是依据不同的数据加工状态(产品化程度)配置相应的权利(包括是否分置),给价值创造者提供制度保障。在这方面,作为原材料的数据或数据集虽然需要配置以权利,使其能够交易,但其权利化必要性却弱于最终产品。作为原材料的数据资源或数据集的价值在于不断流通利用,只需要给持有者配以流通权便足以实现其价值,而最终数据产品持有者则需要相对稳定的控制权或支配权,以便持续提供数据产品和服务,最大化地实现其价值。在前者,按照分享理念配置独立权利就足以实现数据价值;在后者,对于形态和价值相对稳定的数据产品,就存在通过结构性产权分置的制度安排实现其价值的可能。
对于数据资源持有者而言,数据的价值在于计算分析,在于与多少数据关联、组合、聚合,形成不同规模、满足不同分析目的数据集合体,最终由计算分析者创造价值。因此,允许数据资源持有者在其控制下流通数据就足以实现数据的价值,而没有必要让其持续地控制数据,形成独享的事实(即先占者享有排他使用权)。数据资源的独立价值有限,我们需要创制能够最大化实现数据资源的流通利用的秩序。在这样的理念指导下,数据流通结构应当设计为:数据持有者向不同的主体流通数据,数据接受者取得对数据的加工使用权,享有加工使用形成的数据(产品)的持有权;数据持有者可以继续持有原数据并持续地生产和组织数据,形成新的数据集,但不能干预接受者对数据(产品)的后续流通或再利用。这是在承认数据生产和治理是一种持续经济行为的前提下,对数据生产者和数据使用者利益均衡的保护。对于接受数据的主体而言,保护其加工使用利益的最好方式是给予其独立的数据产品持有权,允许其使用、流通和收益其加工产出物,但这并不意味着削弱对原数据持有者利益的保护。因为数据生产者仍保留数据,不仅可以将同一数据流通给多人使用,获取多重利益,而且还可以持续地生产和更新数据,形成持续流通数据的能力。因此,允许向不同主体流通数据并保持在原数据上持续生产的能力,足以保护数据持有者加工劳动的投入,若再赋予其对接受者加工使用数据的产出物相应的权利则会干预加工后数据(产品)后续流通,且会造成对数据持有者过度保护。在流通过程,切断前后手之间的控制关系制度安排有利于激励价值创造,便利数据流通,最大化实现数据的要素价值。
如果我们将数据流通利用过程分立的产权安排看作是产权横向“分置”的话,那么数据产品持有权则可以进行纵向的产权分置。一旦数据产品的形态和价值相对固定,且产品具有广泛的应用价值,我们就应当赋予数据产品持有者更稳定地支配数据产品的持有权。此时,就存在授权他人经营产品或分销产品,即产生结构性产权分置。当数据产品满足标准化、普适性或重用性的要求,并且数据产品的形态和价值固定且具有较长使用价值时,数据持有者可以长期向市场提供该产品,也可授权他人经销或分销数据产品(该主体被称为数据经纪人或数据运营商)。〔39〕数据运营商的数据产品经营权是基于持有者授权,而不是基于加工使用劳动所取得,因而属于数据产品持有者分置的结果。这样制度安排结果是,数据持有者持续地生产数据产品,并通过授权运营来实现产品价值,而运营商则取得数据产品经营权,按照授权协议经营数据产品,分享数据产品市场化利益。由此可以认为数据产品持有权分置出了数据产品经营权。
从数据价值生成和实现特征角度,只要确认原材料阶段的数据生产者以可分享数据产权即可以实现制度设计目标。而当数据被加工使用形成最终的数据产品后,产品生产者即应当享有稳定的产权。此时可以借鉴知识产权原理,给数据产品持有者配置相应的权利。本质上,最终可供社会消费的数据产品,已经不再是数据,而是数据产出物——智能或知识。这类数据产品区别于传统人类创制的内容,是数字产品范畴中的新“物种”。〔40〕
不过,数据要素市场建设的核心是促进可重用原始数据生产和流通,以生产更多数据产品。因为只有原始数据的不断流通才能促进数据汇集、融合计算、机器学习,进而促进知识或数据产品生产。数据要素市场是为生产数据产品提供原料的市场,而不是数据产品市场;数据产品的流通和消费带动数据要素市场发展,但是不能将二者混淆。我们需要赋予数据资源持有者流通权,激励其生产满足数据产品生产需要的数据集,更需要确认数据集持有者的权利,以促进数据集的不断流通。因此,数据持有者权利的配置是数据产品化的动态过程,其享有的权利应当依据其对象或客体的不同而不同,需要依据持有者控制能力和创设价值适配以相应的权利。因此,区分作为要素的数据和作为消费品的数据产品配置不同的权利,是数据产权制度设计的基础。我们需要在此基础上设计数据持有者的权利结构和实现机制,将数据持有者权利行使纳入法律规范体系。
四、数据持有权法律化实现:数据持有者流通利用行为规范
上述论述意味着,与其说数据持有者权是一种数据产权,不如说是构建数据流通利用秩序的制度工具。在数据流通利用过程中,数据持续地变换形态和价值,同时也不断地变换持有者,持有者享有的权利因数据形态不同而不同。换言之,持有权是用来“界定数据生产、流通、使用过程中各参与方”合法权利的制度工具,而不是权利本身。从法律的角度,数据产权本质上作为社会资源的数据权利化构造,需要法律规范权利行使,以实现制度设计的目标——最大化实现数据要素的社会价值。
对于数据持有者而言,基于自己的加工使用,以数据支撑组织效率和绩效的(收益)行为并不需要法律确认和规范。因为获取数据、处理数据和分析利用数据是人类社会自古至今的一项自然法则,只要行为者遵循既有法律规范,保护数据上合法利益,合规和安全地使用数据即可。而数据持有者权利的流通权能或流通行为则涉及第三人或社会利益,需要法律的介入和规范,使该行为结果符合社会共同价值和利益。我们仍然在原始数据和数据产品二分的前提下,以流通权能(行为)为核心,探讨数据持有权法律规范。
(一)数据资源持有者权规范
数据资源是知识生产和机器智能的原料,构建数据使用权为基础的数据资源流通利用秩序是数据二十条》提出的基本制度要求,〔41〕也是数据资源持有权流通权能的基本目标。原始数据的价值在于计算分析、与更多数据关联以及组合或聚合,因而流通是原始数据价值增值的主要方式。流通的目的就是使用数据或者允许接受者使用数据以实现数据的价值。从法律的角度,流通是数据资源持有者的权利,进行流通相当于物权法语境下的“处分”行为。为最大化实现原始数据流通利用,法律上需要建立以下规则,解决阻碍数据流通利用的问。
1.可流通的数据条件
从源头上,数据来源于各社会主体活动和运营,因此,在法律上应当明确各社会主体都可以成为数据资源持有者。数据资源持有者应当是没有门槛的,但资源持有者流通数据仍然需要有加工处理,改变数据的结构、形态、价值等行为,使数据具有可重用性。实质上,每个组织都是社会关系的存在,因而在组织进行数据加工使用的过程中,也会涉及来源于其他主体的数据,一个组织的数据并不完全来源于组织内部。因此,可流通数据至少得满足两个要件:其一合法获取数据,确保数据不侵犯数据上的合法利益,确保数据可为他人所使用;〔42〕其二是对来自内部或外部的数据进行必要的加工、整合和处理,形成可重用数据(集),〔43〕完成数据从初始状态到生产要素的转化。前一个要件是控制合法,后一个要件是流通合法,二者共同构成数据流通交易的合法要件。
2.建立有利于数据流通的制度规则
数据资源持有者要流通的数据,即使存在加工处理活动,形成相对固定的数据集,但是该数据集的生成、存在和使用均存在时效性或时序性,不可能固定化或特定化为“不变数据集”。基于特定数据的产权移转方式无法适用于数据流通,而适合数据流通的是“提供数据给接受者使用”的“供给”方式。在这种方式下,需要确定的是数据提供者持续供给一定数量和质量数据的能力,而不是判断提供者是否拥有特定数据的“产权”。在这里“产权”被替代为数据提供者是否具有合法生产或治理数据的能力、是否可用满足特定使用目的(数据质量)和是否可流通交易(合规)。数据持有者并没有清晰的产权可以公示,法律也无法建立清晰的产权推定或判定规则,因而就必须有适合数据需求者(接受者)判断谁持有(生产)什么数据、数据可用性或质量如何、数据是否可流通(或合规风险)等的规则。一旦这些规则建立起来,那么数据就可以进行合法、安全和便捷的流通。
3.法律应当明确原始数据流通方式
在这方面,法律可以确立两种数据流通方式,即数据使用权让与方式和许可使用方式。所谓数据使用权让与方式即移转原始数据给数据接受者,数据接受者在自己的控制域内持有并使用数据。许可使用方式是数据持有者不移转原始数据,仅给数据使用者访问、调用、计算分析接口或安全环境,由使用者按照约定用途进行计算分析,获取使用结果。两种流通方式均达到了让数据接受者使用数据并取得数据使用产出物 (数据产品)的效果,但是在数据自由度、数据风险控制和数据使用控制方面存在不同,属于适用于不同数据使用场景的数据流通方式。
4.明确数据流通义务
数据资源持有是以社会各主体自身运行生成并适当加工处理形成可用或可重用数据为基础的,因而数据资源持有者反映了数据资源的自然分布。由于每个持有者所生产的数据是都是有限的,而原始数据的价值在于与更多数据的结合,因而流通成为资源持有者实现各自数据价值的唯一出路。承认持有者对数据资源的控制,只是构建数据流通秩序的需要,而不是固定持有者与特定数据的排他使用(支配)关系。数据资源持有者具有合规和安全生产以及管理数据的义务,同时具有数据社会化利用,最大化实现数据社会价值的义务。〔44〕在这个意义上,流通既是数据资源持有者的权利,也其内在的义务。这意味着,应当在法律上强化数据是社会资源的理念,施加数据资源持有者向社会提供数据的义务,构建社会公共数据资源池。比如,在数据来源具有唯一性时,数据持有者就负有向社会提供的义务;当政府从事公共管理和基本公共服务时,持有数据的社会主体应当向其提供所需的数据。〔45〕
5.建立充分竞争的数据资源供给市场机制
确立数据资源持有者权,保护原始数据加工治理者流通和收益的权利在数据要素基础制度中占有非常重要地位,但同样重要的是数据的开放利用,以及保护数据使用需求者能够获取数据。在某种意义上,建立数据资源持有权是开启数据流通利用秩序的需要,而不是将数据置于持有者意志支配之下。因此,在承认数据资源持有者权的基础上,如何防范数据资源持有者控制、封闭数据,拒绝对外提供数据,保持数据源的开放,维持数据资源的可获得性是数据基础制度需要考量的议题。在这方面,本文提出两个方案:在基础理论上,要将数据定位于社会资源,数据来源者应当保持开放,并明确数据持有者负有流通利用数据的义务;在制度设计上,赋予因流通而获得数据的持有者再次加工使用并取得新数据(产品)的持有权,切断前手对后手流通的干预,使每个数据价值创造者享有独立数据持有权,以最大限度促进数据流通利用。只有通过数据来源和供给的开放和多元竞争,才能有效地防止数据封闭和独占。〔46〕
(二)数据产品持有者权规范
数据产品是数据加工利用的产出物,其形态和价值相对固定,是直接具有应用价值的智能成果。确立数据产品持有权便于数据产品市场化交易,在激励数据要素化、产品化利用的同时,赋能整个社会。
数据产品是数据资源的产出物,是数据最终价值的实现。如果我们将数据资源理解为数据产品的生产要素,〔47〕那么数据产品则是整个社会经济的生产要素。从数据资源到数据产品应当看作是各社会主体参与数据生产、流通和使用的结果,这将成为附属或支撑其他经济活动的一种经济活动。每个社会主体既可能是数据资源提供者(流通数据),也可能是数据产品的生产者和提供者,以实现数据的社会化利用。在这一过程中,也会产生专业的数据集成商或数据企业,专门从事数据产品生产和交易活动,成为引领未来社会发展的中坚力量。〔48〕显然,数据产品是数据要素化利用、数据赋能社会经济并转化为生产力的最终体现,保护数据产品持有者权利、促进数据产品交易,是引领数据要素市场建设的重要基础制度。从立法的角度,数据产品持有权应当包含以下内容:
1.数据产品的法律定位
数据产品属于数据分析使用形成的智能成果,智能成果是利用机器学习等技术,基于数据挖掘分析产生的智能工具、智能或知识服务,是区别于人类智力成果的一种新类型的创新成果。如何保护智能成果尚需要进一步探索,而确认数据产品持有者对数据产品的使用、流通和收益的权利应当是实现数据产品生产者权益的制度工具。数据产品区别于数据资源(含数据集)之处在于其形态和价值已经固定,且具有长期使用、可脱离原生环境的交易性,因而权利更稳定和易界定,持有者对数据产品的范围及性能更易描述。〔49〕持有者对所形成的数据产品享有使用、流通和收益的权利,至于具体内容则可能依赖数据产品的类型,甚至有些数据产品的持有者可以获得知识产权性权利(比如著作权或邻接权保护)。不过,承认和保护持有者对数据产品控制和使用,允许通过让与使用权或许可使用交易实现其价值是所有制度设计的宗旨。
2.数据产品持有者权取得及流通规则
数据是智能成果的原材料,而算力、算法等是技术工具,当技术作用于数据即产出数据产品。一旦数据产品的生产者通过合法方式取得原材料和工具,那么即成为所生产产品的持有者。数据产品能否成为像工业产品那样,成为大众消费标准产品,仍然取决于数据产品形态、输出或提供方式。显然,智能工具或模型类产品、人工智能创作物(AIGC)等具有普适性,可以成为大众“消费品”,进行公开市场交易;而在提供知识或解决方案的情形下,数据产品多以个性化服务方式提供,即所谓的数据即服务、数据服务作为服务。在后者情形下,所谓的数据产品持有者所拥有的是集成的“数据资源+计算能力”的智能输出能力,所提供的是个性化的知识或方案。因此,数据产品持有权的公示和判断问题仍然主要依赖生产者与产品之间的“生产关系”来判断,通过实际控制和可外化手段(署名、商号和商标标记)或者登记来实现。〔50〕
3.数据产品交易方式和规则
持有者对所形成的数据产品交易方式取决于所形成数据产品形态。对于标准化和通用性的数据产品(智能工具、人工智能创制品等),可以采取让与使用权或许可使用交易的方式进行交易,受让人取得使用数据产品的权利,应用于业务。对于根据需求提供的数据产品,其流通方式就是服务交易,所提供的是根据需求进行智能分析的结果——知识、答案、解决方案及其场景化的协助服务。不管怎样的流通方式,其流通仍然表现为让与数据产品的使用权,只是这里使用为消费性使用。所谓消费性使用,数据产品使用产生的价值在于支撑决策或业务运行,使用者因此提质增效而获益。消费性使用使数据产品进入社会化大生产中,通过个体生产力的提升形成社会生产力,最终实现数据要素化或产品化的价值。在这一过程中可能会产生新数据或信息,但并不以改进原数据产品的价值为目标,因而不再属于生产性使用。显然,消费性使用完全服务于使用者的业务目的,数据产品持有者对此没有任何干预或控制的基础——此时持有者权用尽。
4.数据产品消费者保护规则
一旦智能成果成为社会经济运行中的消费品,那么对于最终用户权益的保护必然进入法律视野。实际上,从软件和信息服务交易开始,最终消费者保护问题已经成为重要的议题,而数据产品的加入无疑扩展了其保护内容和范围。〔51〕数据产品是为了社会经济应运而生,产品或服务的设计开发、提供的服务必须考虑最终用户的需求,使用户能够完成以前不可能完成的事情或者达到预期的效果。由于数据产品属于数据产品,产品质量具有非易见性,如何减少数据产品提供者的品质保障与使用者之间预期效果的差距,是所有数据产品交易需要解决的问题。最终用户可能通常不太理解产品中的代码、算法和工作原理,其更关心的是产品的易用性、功能性和稳定性,这要求产品应当从普通用户的体验和需求出发进行设计,并不断跟踪一直变化的需求和使用效果。〔52〕如此,数据产品交易需要通过不断改进产品质量和一流的客户服务来实现。
(三)数据持有者授权规范
为促进数据价值实现过程的社会分工,在数据持有者保持持有者地位的情形下,对数据资源或数据产品可以做出以下两种安排,以促进数据要素化和市场化利用专业分工的形成:其一是委托加工,其二是授权运营。
1.委托加工
数据资源持有者可以委托他人加工处理数据,凭借受托人专业技术能力,实现数据要素化或产品化。在法律制度上,受托加工属于提供劳务服务,获取服务对价(加工费) 的交易,因而所形成的数据产品归属于数据持有者,但委托加工协议可以另行约定。〔53〕这样的制度设计是从数据持有者利益出发的一种安排,通过强调当事人自主约定的自由,创造出更多的商业模式。受托加工处理的内容则可以是处理数据产品化的任何一个阶段的数据,可以受托清洗、标注、校验、汇集等治理行为,以形成满足各种分析目的的数据集,也可以是受托运算、训练模型或分析数据,形成最终数据产品或智能成果。显然,在技术能力存在差异的情形下,委托加工是数据资源持有者实现要素化利用的重要路径。
2.授权运营
数据持有者可以将数据市场化业务交给第三方运营,如同工业品需要经销商、分销商或经纪商一样,数据要素市场也需要这样的专业服务。在持有者区分为两类的情形下,授权运营亦可以区分为两类:数据资源持有者授权运营和数据产品持有者授权运营。
对于数据资源持有者来讲,其数据产品化还未开始或完成,因而其授权运营自然就包括授权加工使用数据资源,形成数据产品并向最终用户“销售”。这样的授权实际上是让授权运营者替代授权者行使其本身所享有的加工使用和流通的权利。这意味着被授权主体在授权范围内享有开发数据资源所形成的数据产品的加工使用权利,同时还享有向社会提供所加工使用形成的数据产品的经营权。授权运营者实际上已经取得了数据产品持有者地位,这样的地位是资源持有者授权的结果,因而认为其取得数据产品经营权。这样的数据运营最典型的表现在公共数据的授权运营。〔54〕有偿有条件的数据开放本质上属于流通(即提供数据,受控使用),而政府机构不能直接从事具有商业性质的行为,因而需要授权专业社会机构实施数据治理和对外提供,以控制数据的使用风险。〔55〕
对于数据产品持有者而言,授权内容主要是授权经销或分销数据产品,授权运营者取得数据产品的经销权,自主决定数据产品交易或服务。数据产品属于最终产品,授权运营者需要负责对接市场需求,提供售后服务,管理数据产品使用风险等。在数据产品交易的发育阶段,我们需要鼓励实践探索,发展出一些高效的数据产品分销模式,为立法提供可借鉴的经验。
五、结论
人类进入到机器智能时代后,数字化形成的数据的再开发和利用成为一种需要法律介入的经济活动。在我们强调数据是一种可重复利用、产生经济价值的资源的同时,也不能忘记数据是一种社会资源。从社会可用资源出发构建数据流通利用秩序是数据产权或数据基础制度设计的基本出发点。《数据二十条》提出的数据产权结构性分置是用于“界定数据生产、流通、使用过程中各参与方享有的合法权利”的方法。根据数据价值实现过程中价值创造而配置独立持有权,根据在数据价值和形态的稳定性程度和价值实现保障需求来配置权利内容,在要素化阶段配置分享而非分置的产权,而在数据产品化阶段配置可分置的稳定的持有权是符合数据特征、有利数据价值最大化实现的制度安排。这样的制度安排,没有将数据加工使用权视为一种独立的产权,而将加工使用看作是附属于合法取得数据的权利,因而将加工使用权改造为数据产品持有权。这样的改造强化了数据产权旨在保护加工使用,并将数据持有权看作是数据要素化(产品化)过程中不断动态发展的权利(主体不断更迭),亦可以视为数据产权的横向结构分置。在形成数据产品后,数据产品持有者在构建稳定市场分销体系时,需要纵向产权分置,以给数据产品经销商、经纪商等数据产品市场化主体以明确的法律保护。
数据基础制度建设旨在促进高质量的数据要素供给,赋能实体经济,但同时也应当被视为根据数据要素化(产品化)贡献来配置权利的过程。本文将原始数据持有者视为数据要素化的起始端,将数据产品持有者看作具有直接生产要素价值的末端,在这个过程中任何对数据结构和内容改良的增值行为,都应当被赋予实现其价值的权利,促进数据流通利用,最终生产出数据产品;而数据产品持有者具有赋予较稳定产权的可能性,可衔接现有知识产权保护制度并根据数据产品创设新保护模式。即使没有新权利,持有者的使用、流通和收益三项权利也足以给数据产品创造者以足够的保护。法律要做的事情也许是在数据产品可以长期存在的情形下,规范和限制其权利行使以保护消费者和社会整体利益。
本文只是从商业和法律逻辑的角度,对《数据二十条》的数据产权配置思想作出自己的诠释和一些法律构想。在数据要素化视为一种经济过程情形下,配置怎样的权利以最大化数据要素的价值或者促进数据产品生产和应用需要更需要实践进一步探索。毕竟,只有符合商业逻辑的法律规则,才具有生命力。
本网站之内容旨在提供有关华诚的一般信息。本网站之内容不得被视为与访问者建立律师-客户关系,也不视为是为任何具体事宜提供法律意见。网站访问者应向律师咨询以获得专业法律意见。 对于任何争议的特定事实和情况,在没有获得恰当的法律或其他专业意见之前,本所客户和其他网站访问者不能将华诚网站上的任何信息作为采取行动与否的依据。