第三方数据未拉取不可以出款 公开数据抓取行为的法经济学分析——以博弈论为基本方法
摘要:演化博弈模型作为博弈论的一种分析模型,特别适于分析动态的市场竞争活动。使用演化博弈模型对抓取公开数据行为的经济效应进行建模后,可对典型案例进行分析。
根据建模分析的结果,抓取数据后若直接二次传播且混淆了来源的,对经济效率不利,且市场无法自我纠正,应由《反不正当竞争法》介入调整。若未混淆来源的,需评估二次传播数据是否产生实质性替代效应,若产生,则会对市场造成无法自行消弭的损害,亦应由《反不正当竞争法》介入调整,反之则无需。
对于抓取数据后开发不与数据控制者直接竞争的其他数据产品的行为,尽管存在一定的搭便车现象,但经济分析表明市场可以自行调节达到最优状态,无需《反不正当竞争法》的干预。
该模型和前述分析结论亦通过了现有典型案例的检验,可以适用于此类案件的分析。
目 录
一、导论
二、演化博弈模型
三、演化博弈模型的建立
四、典型数据抓取案例分析
五、 结语
导 论
随着互联网技术的不断发展,数据已经成为当今社会不可或缺的重要资源。在这样一个大数据时代,数据抓取行为已经成为了互联网企业之间的竞争手段之一。其涉及的法律问题也愈加复杂。其中,数据抓取行为是否构成不正当竞争行为是一个备受争议的问题。
在当前司法实践中,数据抓取类不正当竞争纠纷的司法裁判存在着许多困难。首先,数据抓取行为本身并不直接涉及具体的物质对象,这使得司法机构很难对其进行客观的认定和裁判。其次,在法律法规的制定上也存在着差异和不足,这使得司法实践难以对数据抓取类不正当竞争行为进行明确的界定和裁判。
在这样的背景下,本文将采用法经济学的分析方法,对数据抓取行为是否构成不正当竞争行为进行探讨。通过对经济学理论的应用,本文旨在阐明数据要素在当前互联网环境下的重要性,揭示数据抓取行为对市场效率的影响,并以现有案例为基础,对经济学模型进行检验。以期以经济分析的方法,对此类案件处理提出一些自己的见解,以见教于方家。
演化博弈模型
市场活动以及市场竞争活动,尤其是互联网带来的多边经济效应,通常体现为大量市场参与者参与的决策与活动,如需要从宏观上观察市场秩序这一特性,难以构建简单的的双方或多方的博弈模型。考虑到竞争的主要目的即发现优秀的竞争者这一基本功能,加上竞争变动不居的动态属性,可以使用博弈论中的演化博弈模型作为研究的框架。
演化博弈又称进化博弈,是博弈论的一个分支,其源于达尔文的进化论的思想,并将生物学的理论运用到经济学中。按照演化博弈的理论,在一个稳定的种群中,所有的生物达到均衡的状态。如此时生态中的个体随机发生突变(而该突变的取向是完全随机的,即可能向着好的方向突变,亦可能向着坏的方向突变)。继续观察突变发生后种群后续的演化,可能发现两种结果,突变体可能因无法适应环境,在自然选择中逐渐灭绝。突变体也有可能最终得以稳定,并通过繁衍扩张数量最终成为种群基因库中稳定的一部分,此时就称该种突变为进化稳定突变。
在市场竞争的语境下运用该模型,即假定在某一个瞬间的均衡市场中,某一或某一些竞争者突然选择了一个新的竞争策略,由于市场竞争的复杂性,竞争者无法预测该竞争策略的有效性。其可能因错误的竞争策略而最终灭绝,但也可能在市场中得以稳定存在,同时因启发其他竞争者,使得该策略得以传播,成为进化稳定策略。[注1]
演化博弈的分析框架是对动态经济系统观念的响应,与传统的静态和稳态分析框架不同,它将经济学中的“均衡观”与生物学中的“适应性”和“自然选择”的观念相结合,在理性不完全、信息不对称、对别人行为的预期有偏差的基本条件下,演化博弈模型可以描述人们如何通过模仿、学习、试错而不断地对外部世界的冲击做出响应的过程及结果。这一过程与市场竞争中通过不断试错发现优胜者的过程由其相似,因此该模型可用于分析竞争者在市场中的竞争决策以及竞争秩序。[注2]
在本文中,某竞争策略如不能增进社会福利的,应属于劣势竞争策略。可以增进社会福利的,应属于优势竞争策略(需要注意的是,因为竞争活动中,几乎必然会导致其他竞争者的福利受损即竞争性损害,因此这里的福利的增进均指卡尔多-希克斯改良而非帕累托改良)。
一个好的市场,应当可以发现优势竞争策略,淘汰劣势竞争策略,最终实现社会整体福利的不断发展。但如果某种劣势策略,突破了竞争秩序的束缚,成为了进化稳定策略,最终在自然选择的浪潮中不仅没有被淘汰,反而得以大范围传播最终稳定在某一种群之中,则说明这种劣势策略可能成为这一种群的“固有基因缺陷”。那么此时该种策略就属于破坏了市场竞争秩序,最终导致竞争失灵的策略,此时就需要法律的介入予以调整。下文便以该种假设为基本前提开展建模分析。
演化博弈模型的建立
以博弈论中经典的“合作-非合作”模型,将市场参与者分为数据控制者和第三方两类进行建模,第三方是指数据控制者之外获取数据的主体。
该博弈的回报矩阵如下:
上表中:
1. 对于第三方来说,合作即意味着利用数据控制者的公开数据,不合作意味着不实施该项业务。显然,对于第三方来说,只有在自己实施,且对方配合的情形下,才可能产生回报a,其他情况均不会有任何回报。
2. 对于数据控制者来说,合作意味着容忍第三方的行为,不合作意味着拒绝第三方的数据获取和使用行为。在容忍第三方行为的情况下,可能给自己产生一定的引流效应,相应产生回报b.同时,因为在此情况下,数据控制者可能也丧失了部分访问量,该部分访问量对应的回报为c。如果第三方选择不合作的情况下,则双方不会有任何交集,所以(不合作,合作)策略对数据控制者一方的效用也为0。但因该模型中对应数据为公开数据,如数据控制者选择不合作,则相应会产生一定的控制成本d。
以上a,b,c,d四个变量均为大于等于0。
另外,本文假设,第三方的数据获取行为遵循一定限度和频度,不会给数据控制者带来显著的服务器负载成本或其他成本,即数据控制者容忍其行为不会产生额外的直接成本(机会成本除外)。
假设市场中,选择合作的第三方的比例为y,选择不合作的第三方的比例为1-y,选择不合作的数据控制者的比例为x,选择合作的数据控制者的比例为1-x。
而系统系统收敛至哪个均衡点,取决于初始状态[注4]。在公开数据获取这一场景下,初始状态可以合理假定为数据控制者全部从合作(即不采取额外措施控制数据抓取)出发,第三方是否获取数据取决于是否有正的效用。下面区分第三方获取数据后的不同用途分别分析博弈结果。
典型数据抓取案例分析
获取数据后通常伴随着一定的使用行为,司法实践中也鲜见单纯因抓取公开数据而产生的纠纷,获取数据后的利用行为往往是认定行为是否正当的重要因素。因此本文区分抓取后不同的利用行为分别进行分析。
(一) 抓取数据后直接二次传播
此类案件是指数据控制者之外的第三方,取得了数据控制者控制的公开数据后,不加以加工直接对外二次传播。同时,实践中存在传播时混淆来源以及不混来源两种情形,本文分别予以分析。
1. 混淆来源的情形
在此情况下,因直接二次传播且混淆来源,所以不会给数据控制者带来正面效应,即b=0。从第三方获取了相应数据的用户,自然不会再去数据控制者处再获取一次数据,从流量损失看,第三方获得的流量至少就是数据控制者损失的流量。同时,因为混淆等原因,导致数据控制者的商誉可能收到损害,所以可以合理假设在该种情况下c>a,即(合作,合作)均衡点的总体效用a+b-c
此时若c
先从定性的角度也可以分析一下此时情势,在该种情形下,数据控制者处于净损失的状态,这个竞争情势持续下去极有可能导致是搭便车的第三方越来越多,而数据控制者控制、维护和公开数据的动力越来越弱,且盈利能力因第三方的侵蚀逐渐被进一步下降后,将更难以支付采取防范第三方获取的措施费用,数据控制者在该均衡中将处于无法自救的状态。
从定量的角度分析,社会总回报最高的应当为第三方不获取数据,数据控制者也不采取技术措施去防范(或采取成本不显著的措施,如机器人协议)他人获取数据的均衡点,此时的社会总效用为0,大于均衡点a-c的总效用,因此此时的均衡点是不具有效率的。
进一步的,若c>d,即第三方获取数据带来的损失已经大于采取技术措施防止他人获取时,数据控制者可能会纷纷转向“不合作”,即将数据封闭起来。但显然此时的社会总效用也是-d,也并非最优状态。同时,因为在博弈模型中,每个个体决策时考虑的都是自身的回报,并不考虑外部效应,因此此时的-d的社会总损失还未包含数据封闭带来的“数据孤岛”等负外部效应。因此该均衡状态显然也是不具有效率的。
因而,在此情形下,通过正常的博弈产生的均衡点均不是社会福利最优的状态,甚至可能损害整个行业。但市场参与者又无法自发地从该均衡中解脱出来。此时就需要《反不正当竞争法》的外力介入,将此类的数据获取及使用行为定性为违法,使得防范他人抓取数据的成本d尽可能接近于0(因诉讼成本的存在,最终难以等于0),尽可能使系统稳定在总成本最低的均衡点。
司法实践中,法院也多以此尺度进行裁判:如C公司诉A公司案中。C公司运营的平台收集了大量用户提交的关于车辆质量评价的数据。A公司未经允许直接原样复制了5万余条评价信息刊登在A公司网站上用于引流。C公司认为A公司行为侵犯了其合法权益,但其对用户提交的质量评价并不享有著作权,无法提起著作权侵权之诉,进而向法院提起了不正当竞争之诉。法院最终认为,A公司的行为构成不正当竞争。[注5]法院虽然未从经济角度进行定量的分析,但其最终结论与本文的经济分析结论可以相互印证。与此类似的还有D公司诉A公司案、T公司诉J公司案、H公司诉W公司案、Y公司诉Z公司案,X公司诉F公司案等。[注6]
2. 不混淆来源的情形
此类案件以D公司诉B公司案为典型代表,在该案中,D公司运营某点评平台,B公司开发了地图应用,并在地图中对应的商户中,直接展示了D公司平台上展示的商户点评数据,且数量巨大。D公司遂提起了不正当竞争之诉。该案中,B公司虽然原样大量地搬运了D公司的数据,但标明了出处,B公司也以此作为抗辩点之一。在与该案件类似的情形下,B公司因获取D公司数据获得正效用a,D公司因B公司的行为可能产生一定的引流收益b,但同时也受到了相应的损失c,最终在初始状态下的均衡回报为a+b-c。此时,如果满足a+b>c,在此均衡状态下是卡尔多-希克斯最优的,即社会总回报最高。若同时满足b-c>0即数据控制者的引流效应大于损失时,甚至可以达到帕累托最优,即所有人的状态都得到了改善。这也是为什么在该案判决书中,法院指出:“本案中,当用户在B公司地图软件上搜索某一商户时,不仅可以知晓该商户的地理位置,还可了解其他消费者对该商户的评价,这种商业模式上的创新在一定程度上提升了消费者的用户体验,丰富了消费者的选择,具有积极的效果……但如果存在明显有对D公司损害方式更小的方式而未采取,或者其欲实现的积极效果会严重损害D公司利益的情况下,则可认定为使用方式已超过必要的限度……本案中,B公司通过搜索技术抓取并大量全文展示来自D公司网的信息,本院认为其已经超过必要的限度”,并提出了实质性替代标准。[注7]该标准也在2022年的《反不正当竞争法(草案)》中被吸纳。即一旦达到了实质性替代的结果,使得b-c
与D公司诉B公司案相反的是,在Q公司诉Y公司案中,被告Y公司的网站为用户提供整合各大招聘网站信息的功能,即将用户已经在包括Q公司网多个网站上取得的简历等数据,通过“关联外网账号”的功能,汇总至Y公司的网站上,实现“关联外网账号并同步职位,HR无需每天分别登录多个招聘网站,只需登录Y公司网站便可一站式处理多个渠道的主投简历,同时可以在Y公司网站轻松完成一键发布、刷新等职位管理工作”。该行为本质也是数据的原样搬运,但其并未替代Q公司等招聘网站的效果,用户购买简历等操作仍然要到相应的网站上进行。Y公司仅提供了信息汇总的服务。法院认为,该经营模式可能导致Q公司企业用户因不需要频繁登录Q公司网站查看简历,从而带来Q公司网站访问量降低、广告展示机会减少等不利影响,但影响有限,尚未达到需要通过反不正当竞争法救济的必要。[注8]
在该案中,法院定性地提出了Q公司的流量受损并不需要《反不正当竞争法》救济。将该案情带入前述模型中,可定量的体现为:虽然存在-c的损失,但c明显较小且因正效用a(“该技术可以提高工作效率,给市场主体带来便利”)的存在,使得该均衡为社会福利最优化的均衡点。此时的状态应当认为是通过市场竞争选择出的最优策略组合,无需《反不正当竞争法》的介入。
因此,在此类案件中,需判断对数据的二次传播是否产生了实质性替代的效应,如产生,则会给市场造成损害,应当由《反不正当竞争法》介入调整,反之则无需。
(二)抓取数据后开发其他数据产品
该类情形是指第三方从数据控制者处抓取数据后,开发与数据控制者不存在直接竞争关系的数据产品。
在此情形下,在初始状态(合作,合作)均衡下,第三方因开发其他数据产品而获益a,而产品因与数据控制者无竞争关系,不导致数据控制者受损,即c=0,同时可能会产生对数据控制者的引流效应,即b≥0。
此时均衡点的社会总效用为a+b,且因无人受损,是帕累托最优的。因此,除非存在其他情节(如恶意、高频次爬取数据导致服务器产生无法忽视的负载,此时会产生数据控制者的损失c,可参考前述非混淆二次传播情形类比适用),否则无需进行干预,各方形成的均衡状态就是竞争选择出的最优策略组合,无需《反不正当竞争法》介入调整。
该分析结论与司法实践中的典型案例不谋而合,如Y公司诉X公司案中,原告Y公司开发的“Y系统”系一款舆情分析软件,其可自动爬取X公司中的公开、半公开以及非公开数据,并提供相应的舆情分析报告。对于公开数据的爬取,法院认为“基于网络环境中数据的可集成、可交互之特点,平台经营者应当在一定程度上容忍他人合法收集或利用其平台中已公开的数据,否则将可能阻碍以公益研究或其他有益用途为目的的数据运用,有违互联网互联互通之精神。”[注9]
与该案类似的,还有T公司诉C公司案,该案中,被告利用T公司平台的数据,开发了比价工具“购物党”,法院认定单纯的比价工具以及安装在浏览器中的比价插件并不属于违反公认的商业道德的不正当竞争行为,原告T公司也直言,并不反对比价工具的应用。[注10]在T公司诉M公司案中,杭州铁路运输法院也认为:“如果M公司是在合法获得‘生意参谋’数据产品基础上通过自己的创新劳动开发出新的大数据产品且能够给予消费者带来全新体验的,这样的竞争行为难谓不正当。”[注11]
T公司诉Z公司案中,被告Z公司开发了“帮5淘”比价插件,在用户登陆T公司平台时会出现相关横幅等比价信息,上海知识产权法院认为:“比价、帮购等服务本身而言,可能给消费者带来一定福利,即单纯的比价服务并不扰乱市场竞争秩序。但该案中,被告还存在嵌入链接,误导用户跳转至自己运营的“帮5买”网站的情形,法院虽然最终从误导消费者、构成混淆的角度,判决被告构成不正当竞争,但并未否认比价服务这一数据服务产品的合法性。[注12]
因此,此类竞争行为虽然依附于作为数据源的数据控制者一方提供的数据,存在一定的搭便车情节,但基于前述经济分析,该搭便车的行为并未达到需要《反不正当竞争法》介入调整的程度。
结语
本文以演化博弈模型为基本模型,对抓取公开数据这一行为进行经济分析。最终得出结论认为,对于抓取数据后直接二次传播时需区分是否混淆来源,如混淆来源,则该行为对经济效率是不利的,应当由《反不正当竞争法》介入调整。如未混淆来源的,需判断对数据的二次传播是否产生了实质性替代的效应,如产生,则会给市场造成损害,应当由《反不正当竞争法》介入调整,反之则无需。
对于获取数据后开发不与数据控制者直接竞争的其他数据产品的行为,此类竞争行为虽然存在一定的搭便车情节,但基于前述经济分析,市场可以自行调节达到最优状态,无需《反不正当竞争法》的介入调整。
进一步的,本文结合典型案例,对本文建立的模型进行了检验,验证了该模型在司法实践中的适用性。
注释及参考文献