ai绘画的版权 简析AI绘画著作权风险及规制建议
引言
2024年2月16日,公司发布视频生成模型Sora,极大拓展了人工智能在视频生成领域的能力。用户仅需输入简单的文字描述,Sora即可快速生成时长约一分钟的视频,Sora的横空出世再次震撼了整个世界,助推生成式人工智能( ,以下简称“AIGC”)成为社交圈近期广泛讨论的热点话题。
AI绘画是AIGC技术的一项分支应用,具有丰富的商业应用场景和广阔的市场发展空间,是各大AI科技公司均在布局的新赛道。目前国外较为流行的AI绘画工具主要是 和,国内同样有文心一格、360智绘、通义万相等类似功能的AI绘画工具。根据国泰君安研报的预测数据,未来5年,AI绘画在图像内容生成领域的渗透率将达到10%-30%,市场规模或将超过600亿元[1]。
AIGC 技术的发展速度令人惊叹,但新技术的颠覆性变革也对现有法律制度体系造成冲击。伴随着AI绘画市场的迅速扩张,相应的法律问题也层出叠见,比如在著作权法领域,AI绘画模型未经授权抓取版权图片训练AI模型的行为引起了艺术家和图片公司的警惕;在人格权领域,AI绘画工具强大的“一键换脸”功能被广泛使用并传播,可能涉嫌侵犯人格权的问题。有鉴于此,本文简要介绍AI绘画的生成及运行机制,重点分析AI绘画可能存在的著作权风险及特点,并据此提供风险规制建议。
01
AI绘画的生成及运行机制
就AIGC而言,《生成式人工智能服务管理暂行办法》(以下简称“《AIGC暂行办法》”)第二条将其定义为“利用生成式人工智能技术向公众提供生成文本、图片、音频、视频等内容的服务。”AI绘画,首先是AI从海量图文对应的数据中学习到了“语言描述”与“艺术画面”的关联。在此基础上,当用户输入一段语言描述,希望创作一幅新的画作时,AI将调动以上学习到的知识和能力开始创作,经过数百轮不断修正画作,每一轮都会仔细检查草稿与语言描述的一致性,以期让作品与输入的语言描述具有准确的关联。在这个修正的过程中,整体的构图不断明晰,最终形成在审美上与人类经验与知识高度一致的成品[2]。
各类AI绘画工具均需借助AI算法模型实现,而AI算法模型则需要对海量图片进行深度学习,AI算法模型各有不同且都有优缺点,从微观角度解释AI算法模型会稍显晦涩难懂,但是从宏观层面而言,AI绘画工具的生成及运行过程主要分为图片输入、深度学习和内容输出三个阶段,以下将分阶段介绍AI绘画的生成及运行机制。
1. 图片输入
图片输入阶段的主要任务是导入图片并建立模型,AI算法模型开发者会通过爬虫等工具在互联网上搜集抓取数亿级别的海量图片,并对拟输入的图片进行筛选、分类、标记从而建立深度学习需要的图片数据库,输入图片的数量和质量最终也将影响生成图片的质量。AI算法模型可分为算法和参数两个部分,AI算法模型开发者基于不同需要对算法和参数进行调整,在图像识别领域一般使用卷积神经网络或者卷积神经网络图像分类算法模型[3]。AI算法模型开发者在输入阶段将海量图片作为训练样本“投喂”给AI算法模型学习,并通过调整算法和参数进行迭代更新。
2. 深度学习
在深度学习阶段,AI算法模型创作的机器学习原理类似于人脑的思考过程。AI算法模型对训练样本图片进行分析处理,总结这些图片的像素值规律,再依据这些规律生成新的图片,AI算法模型开发者会对生成图进行校验并作出反馈,AI算法模型则会依据开发者的反馈修正其所总结的规律、再依据这些规律进行新一轮的图片生成,如此循环往复直至AI生成的图片满足了开发者设置的标准,此时可认定AI算法模型掌握了这一生成规律[4]。
3. 内容输出
在内容输出阶段,AI绘画使用者会先将个人对图片的需求以提示词()或参考图的形式输入AI绘画工具,同时设置采样迭代步数、提示词相关性等参数,AI算法模型基于使用者输入的文字搜寻对应的图片,再利用其在深度学习阶段掌握的规律对这些图片进行分析处理、最终生成数张符合要求的图片,AI绘画使用者可以在其中挑选中意的图片[5]。
02
AI绘画创作的著作权风险分析
1. 输入阶段
在输入阶段,AI绘画算法模型训练时需要爬取海量图片“投喂”给算法模型,这些图片难以避免会包括他人享有著作权的作品,甚至是大家耳熟能详的知名卡通形象作品(比如奥特曼、米老鼠、蜘蛛侠等)。根据《著作权法》第三条规定,美术作品、摄影作品及设计图等图形作品均为著作权法的保护对象。结合《著作权法》第十条规定,上述作品的著作权人依法享有发表、复制、改编、信息网络传播等著作权。AI算法模型输入图片时,需要对图片信息及特征进行数字化处理,从而转化为AI算法模型可以理解的标准格式,因此在数据输入阶段无法避免对原图片信息和特征的复制,存在构成侵犯原图片著作权的风险。
根据《AIGC暂行办法》第七条规定,AIGC服务提供者应当依法开展预训练、优化训练等训练数据处理活动,应当使用具有合法来源的数据和基础模型,涉及知识产权的,不得侵害他人依法享有的知识产权。因此,AI算法模型开发者在训练模型阶段需要遵守知识产权合规性要求,尊重他人享有著作权的作品。
关于AI算法模型在输入阶段使用他人享有著作权的作品是否构成侵权,国内司法实践暂未出现相关判例,但国内学者对此持有不同观点,比如王利明教授认为“如果生成式人工智能使用相关数据训练模型的时候未经著作权人授权,有可能会侵害著作权[6]”,也有部分学者认为“著作权人是否能够对人工智能学习和训练行为主张权利,在各个国家依然是有争议的问题,这个问题有待法律明确,目前不宜轻易得出该行为是否构成侵权应立即予以禁止的结论。虽然目前我国强调加强著作权的保护,但不能因此排除对出于人工智能学习、训练目的的数据挖掘行为适用合理使用条款的可能性[7]。”
这在其他司法辖区也是如此,例如近一年来美国存在多起相关诉讼,原告包括美国作家协会、Getty 和New York Times等,被告则为Open AI、 AI等AI算法模型开发者和运营者。但在这一系列案件中,对于合理使用抗辩的主张不尽相同,法院的认定标准是否可能趋同也有待观察。其中,在美国加州联邦法院 AI集体诉讼[8]一案中,原告指控公司直接侵犯著作权的主要依据是:购买数亿受版权保护的图片作品副本并将其用于训练 模型。从输出端()入手进行举证,在专门查询图片作品是否被AI公司扫描的第三方网站上输入自己的名字进行查询,发现自己的一些(而非所有)登记作品已被用作AI训练图像,该证据得到采信。法官最终认定公司获取图片副本以训练 模型的行为构成直接侵犯著作权。
2. 学习阶段
在学习阶段,AI算法模型需要将图片语言通过机器翻译转化为机器语言,如此方可将海量图片数据输入预先设定的算法模型进行训练。该阶段学习的图片以输入阶段的图片数据为基础,如果输入阶段的图片存在著作权侵权风险,则学习阶段当然也构成侵权。但输入阶段不存在侵权的情况下,学习阶段对图片的处理是否同样会引起著作权风险?
根据学习阶段的AI算法模型原理,输入的图片在AI学习过程中会被无数次的复制、模拟、再复制,在此过程中图片数据只是一种暂存状态。在 LP,LLLP v. CSC , Inc.案中,美国联邦第二巡回上诉法院认为,尽管被告服务器缓存中确实呈现出原告的作品,但是持续时间非常短(该案中为1.2秒),因此不符合美国《版权法》中对侵犯复制权的规定[9]。临时复制本身不符合著作权法意义上复制的特性,将临时复制纳入复制权范畴,将不合理地扩大著作权人的权利,不利于他人对信息的获取。因此,著作权法并不承认临时复制是著作权法上的复制行为。换言之,在AI学习过程中,临时复制并不构成对复制权的侵犯。但非临时复制符合侵害复制权的构成要件,构成侵权。
3. 输出阶段
在输出阶段,AI绘画工具根据使用者的指令输出成果,此类AI绘画是否属于著作权法意义上的“作品”,目前学术界对过该问题的争议较大。有学者认为AI绘画生成物具有独创性,是著作权法意义上的“作品”[10]。也有学者认为现阶段的人工智能属于弱人工智能,机器学习等均是以一定算法或模型为基础,由此产生的生成物不是著作权法上的作品[11]。近日北京互联网法院AI绘画著作权侵权纠纷作出一审判决,该案成为我国AI生成图片著作权侵权第一案。关于是否构成“作品”的问题,北京互联网法院在(2023)京0491民初11279号案件中重点论述了AI绘画图片属于“智力成果”以及具有“独创性”两个要件,并据此认为AI绘画图片构成作品,应当受到著作权法保护。
如果认可AI绘画生成物是作品,那么该作品的权利归属需要进一步明确,以便确定侵权时的责任主体。学者关于AI绘画生成物的权利归属如何认定主要存在以下几种不同意见:认为是归AI算法模型开发者或AI绘画运营者,或是归AI绘画使用者,或者归AI本身。著作权制度的立法初衷之一是保护自然人的利益,通过法定方式赋予作者一定时间内享有专有权,填补作者的付出,以达到促进文化发展与传播的目的。AI算法模型或计算机仅仅是人类的附属物,不具有独立的法律人格。如果认为AI绘画生成物是著作权法意义上的作品,其权利归属应当是自然人,既是当下社会环境的诉求,也是自然秩序的要求[12]。北京互联网法院在(2023)京0491民初11279号案件中同样认为人工智能模型设计者仅是创作工具的生产者,AI绘画使用者是直接根据需要对涉案人工智能模型进行相关设置,并最终选定涉案图片的人,涉案图片是基于AI绘画使用者的智力投入直接产生,且体现出了AI绘画使用者的个性化表达,故AI绘画使用者享有涉案图片的著作权。
如果AI绘画生成物与输入阶段用以训练的图片作品构成实质性相似,则该等AI绘画生成物可能构成对原作品的著作权侵害。输出内容存在侵权时AI算法模型开发者或AI绘画运营者是否应当承担责任。目前中国司法实践已有相关案例出现,广州互联网法院在(2024)粤0192民初113号案件中认为AI绘画运营者生成包含奥特曼版权元素的内容侵犯了奥特曼原作的复制权和改编权,并判令案涉AI绘画运营者承担停止侵权及赔偿损失等民事责任。在美国加州联邦法院 AI集体诉讼[13]一案中,美国法院以原告未能证明AI绘画生成物与原告作品相似的仿冒内容这一事实驳回了原告的该项诉讼请求。
03
AI绘画的著作权侵权特点
AI绘画的生成数量和创作速度均远远超过艺术家的平均水平,因此AI绘画涉嫌侵权的作品数量庞大。与传统的著作权侵权行为相比,AI绘画的著作权侵权存在以下特点:
1. 侵权行为认定困难
对于著作权侵权行为的认定,司法实践中一般采用“接触+实质性相似”原则,该原则具体指只有证明涉嫌侵权作品与受著作权保护的作品构成实质相似,同时作品权利人又有证据表明被告在此前具备了接触原作品的机会或者已实际接触了原作品,才能判定为著作权侵权。但是AI绘画对“接触+实质性相似”原则提出了如下挑战:
对“接触”要件而言,AI绘画使用者只是输入了文字指令,并未接触在先受著作权保护的作品。事实上“接触”在先作品的是AI绘画算法模型,这就涉及对“接触”要件的理解和判断,AI绘画算法模型对作品的接触可否视为AI绘画使用者对绘画的接触。
对“实质性相似”要件而言,AI绘画生成物对每部作品色彩、线条等要素的使用量较低,呈现零散和碎片化的特点。AI绘画生成物可能同时侵权多个著作权人的多部作品,但侵权内容对每部作品而言所占的数量和比例均较低,这就导致“实质性相似”的判断标准难以明确。对原作品著作权人维权而言,AI算法模型训练时抓取的图片数量巨大,提取的图片元素维度多种多样,如何对成千上万张AI绘画生成物与自身作品的相似度进行认定,对于著作权人显然有较大难度。
2. 侵权的责任主体认定及责任划分困难
AI算法模型本身不是法律主体,也无法承担相应法律责任。AI算法模型开发者、AI绘画运营者及AI绘画使用者,参与AI绘画的开发与使用。如上文所述,AI绘画生成物的产出通常要经过内容输入阶段、 机器学习阶段和内容输出阶段, 三个阶段都面临着一定的侵犯著作权的风险,可能涉及到AI算法模型开发者对画作数据抓取程序及软件自我学习的设计,也可能涉及到AI绘画运营方对画作数据库的管理,也包含AI绘画用户自身思想与情绪的表达。原画著作权人维权时应该向哪些主体主张权利以及上述主体的责任如何划分,同样值得讨论。
对于AI算法模型开发者而言,其无法控制AI绘画使用者的使用目的,是用于个人学习欣赏还是其他商业目的,这完全取决于AI绘画使用者。在无法证明AI算法模型开发者存在明显过错的情况下,如果要求其承担侵权责任,则会极大伤害开发者的研发热情,不利于整个AI绘画行业的未来发展。
对于AI绘画运营者而言,虽然广州互联网法院在(2024)粤0192民初113号案件中已判令AI绘画运营者承担侵权责任,但同时广州互联网法院在判决书中也强调了“不宜过度加重AIGC服务提供者的义务”,呼吁建立一个平衡、包容、兼容创新与保护的中国式人工智能治理体系。
对于AI绘画使用者而言,如果认为其享有AI绘画生成物的著作权,则基于权利义务相一致的原则,其有可能需要对该等作品的侵权问题承担责任。但如果AI算法模型在训练阶段就存在较大侵权隐患,使用者只是将AI绘画作为一种创作工具时,由使用者承担侵权责任也有失公允。
因此,一旦发生AI绘画生成物侵权事件,该由哪个主体承担侵权责任以及如何划分责任比例及大小将会成为一个新的难题,后续有待司法实践的案例进一步明确上述问题。
04
AI绘画的著作权风险规制建议
基于以上对AI绘画著作权风险与侵权特点的分析,为有效防范AI绘画创作在各个阶段的著作权风险,我们提供以下规制建议,供AI绘画行业的相关参与主体及监管部门参考:
1.
在内容输入阶段,面对AI绘画在前期的数据收集阶段可能存在的著作权侵权风险,AI算法模型开发者可以在现有法律制度下寻求并采用合法获取数据的方法,尽可能避免因未经著作权人许可使用其权利作品而引起侵权的情形。但是,面对大量的图片数据,AI算法模型开发者很难识别哪些图片属于作品,作品的真实权利人以及权利人是否有权授权该图片等,后续需要整个行业共同解决如何创建更为便捷的授权方式。尽管理论上可以通过著作权集体管理组织获取授权,但训练所需图片超乎寻常的量级及其对应授权规模,将为开发者带来难以负荷的授权成本。此外,在未建立延伸性集体管理制度的情况下,同样会面临多数作品未纳入集体管理的授权障碍。
就这一实践困境而言,国家有关部门也可以考虑在现有制度上进行创新,为AI算法模型训练学习阶段的作品使用设置合法性依据。目前业内讨论较多的主要有两种思路:一是在著作权法中增设AI算法模型训练学习的合理使用例外或数据挖掘例外。二是设置法定许可制度来优化AI绘画中图片数据的使用授权机制,即AI算法模型开发者可以不事先获得作品权利人的许可直接使用作品,仅需向权利人支付合理报酬。
此外,参照近日全国网络安全标准化技术委员会正式发布的《生成式人工智能服务安全基本要求》,我们理解AI算法模型开发者在输入阶段可能有必要遵循进一步拓宽的防止侵犯著作权的注意义务,包括但不限于:1)设置语料及生成内容的知识产权负责人,并建立知识产权管理策略;2)建立对语料中的主要知识产权侵权风险进行识别的机制等。
2.
对于AI绘画运营者而言,参考广州互联网法院在(2024)粤0192民初113号案件中的观点,其作为AIGC服务提供者,在内容输出时应积极履行合理注意义务,主要包括:1)应按照《AIGC暂行办法》第十五条规定,建立投诉举报机制,使得权利人可以通过投诉举报机制来保护其著作权。2)应按照《AIGC暂行办法》第四条规定,通过服务协议等方式提醒/教育用户尊重他人知识产权,并在充分考量自身技术特性与权益诉求的情况下,参考目前通行的行业实践,向用户告知生成内容的知识产权相关风险, 并就知识产权侵权风险的责任与义务进行约定。
3.
对于AI绘画使用者而言,为减少侵权发生的几率,使用者向AI绘画输出指令时应尽量回避与知名艺术家或知名作品相关的提示词。如果使用者指令AI绘画模仿知名画家的风格或者相关作品时,应特别重视AI绘画生成物与该画家作品是否构成“实质性相似”的比对,以降低侵权风险。
向下滑动阅览
脚注:
[1] 陈义:《AI绘画成新晋“流量密码” 产业发展机遇与风险并行》,载《通信信息报》2022年12月14日,第006版。
[2] 侯伟:《AI作画,版权归谁?》,载微信公众号“中国知识产权报”,2022年10月25日。
[3] 彭飞荣:《论算法创作中涉数据的著作权侵权风险及其化解》,载《法律适用》,2023年第4期。
[4] 张赟洁:《AI绘画生成物的著作权争议研究(一):AI绘画的运行机制与争议梳理》,载微信公众号“水木网络法学”,2023年12月21日。
[5] 同上注。
[6] 王利明:《生成式人工智能侵权的法律应对》,载《中国应用法学》,2023年第5期。
[7] 习睿:《又有AI产品被质疑侵权,AI绘画与隐私保护如何平衡?》,载微信公众号“Tech星球”,2023年8月18日。
[8] v. AI Ltd., 2023 U.S. Dist.
[9] 何隽:《大数据知识产权保护与立法:挑战与应对》,载《中国发明与专利》,2018年第3期。
[10] 吴汉东:《人工智能时代的制度安排与法律规制》,载《法律科学(西北政法大学学报)》,2017年第5期。
[11] 王迁:《论人工智能生成的内容在著作权法中的定性》,载《法律科学(西北政法大学学报)》,2017年第5期。
[12] 刘友华、魏远山:《机器学习的著作权侵权问题及其解决》,载《华东政法大学学报》,2019年第2期。
[13] 同注释[8]。
本文作者
刘迎
合伙人
知识产权部
业务领域:知识产权和商事争议解决,体育法
刘迎律师对知识产权、数据权益保护、不正当竞争纠纷等有较为深入的研究,也擅于处理各类商事纠纷,曾协助众多知名企业参与处理上百件知识产权和商事诉讼、仲裁案件。同时,刘迎律师为中国法学会体育法学研究会理事,曾参与众多大型体育赛事相关法律服务工作,对体育赛事运营和商务开发、运动员训练及管理、电子竞技等方面有较为深入的研究和丰富的经验。
吴涵
合伙人
合规业务部
业务领域:网络安全、数据合规与治理
吴律师主要协助企业在数字经济转型期发挥数据驱动力,实现数字化转型、数据商业化及智能化应用。具体包括协助客户制定修改隐私政策、算法可解释性声明,制定跨境数据传输计划,制定数据商业化合规方案,搭建算法治理体系,梳理企业数据(包括个人信息保护)合规体系,进行网络安全和数据合规自查,协助搭建数据融合的商业及合规框架,构建企业数据资产体系等。吴律师擅长从中国合规的角度为跨国企业在中国的分支机构提供网络安全、数据治理及智能合规意见。同时吴涵律师能够立足中国相关法律法规,为中国走出去企业建立符合欧盟(GDPR)及美国(CCPA)等跨司法辖区要求的网络安全、数据合规及智能化监管体系。项目覆盖金融、保险、健康医疗、人工智能、网约车平台、航空、消费电子、互联网广告、汽车、电商等多个行业。
何光远
主办律师
知识产权部
张浣然
律师助理
合规业务部
转载声明:好文共赏,如需转载,请直接在公众号后台或下方留言区留言获取授权。
封面图源:画作·林子豪