DeepSeek时代,人工智能生成内容的知识产权归属

2025-03-17 10:43

人工智能

详细内容

导读:随着国产大模型为代表的人工智能飞速发展,文心一言、豆包、Qwen 2.5-Max、DeepSeek等AI产品的发布,中国在人工智能技术实现突破性进展。在各个领域均产生深渊影响,特别是对现有创作模式产生颠覆性的变化,给用户带来便利的同时,对知识产权法律保护带来前所未有的机遇与挑战。我国现有法律法规对人工智能生成内容是否属于法律保护的客体,以及权利归属未做明确的规定。《互联网信息服务算法推荐管理规定》《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》等法规的实施,旨在预防技术滥用带来的各类安全风险,确保技术创新发展符合法律规定,确保利用深度合成服务、及生成式人工智能技术在算法设计、训练数据选择、模型生成和优化、提供服务等过程中合规安全,风险防范、防止技术滥用。在科技创新和新质生产力发展的新时期,人工智能产品在数据训练、知识蒸馏、“作品”输出等过程中所涉及的法律问题,特别是知识产权问题有待法律法规进一步明确和完善,促进科技创新和人工智能安全可靠发展。


生成式人工智能产品数据训练、模型生成过程中数据和内容来源

人工智能产品在数据训练和模型生成过程中,数据和内容的来源广泛且多样多,涉及多种渠道,涵盖公开数据、用户生成内容、第三方合作数据等。 主要来源于1、公共数据集,通常由政府机构、学术机构、研究组织或企业发布,及开源社区数据;2、网络爬取数据,即通过自动化工具从网页、社交媒体、音视频平台、论坛等互联网抓取公开内容;3、用户生成内容(UGC),用户在使用过程中主动提供的数据(如输入交互内容、行为数据、上传内容);4、合作或授权数据,通过企业数据合作、政府数据授权、数据市场合法购买等方式获取专有数据;5、合成数据,利用生成对抗网络(GAN)、扩散模型等技术,人工生成符合特定分布的数据,例如生成虚拟的人脸、语音、文本等;6、开源与公共内容,遵循开放许可协议所获取的开源和公共内容;7、内部数据,企业在日常运营过程中积累的业务数据,如一些垂直领域的交易记录、用户行为日志等。这些数据经过知识蒸馏、数据清洗、内容标注、扩展增强等用于模型训练和验证,最终根据用户指令生成相对应的内容;从输入端看,训练数据是否经原权利人授权或许可,已经成为生成式人工智能合规发展中制约性的难题,以及输出内容终端用户、模型提供者是否享有著作权,也是法律监管和司法实践中面临的难点问题,有待法律明确和完善。


人工智能生成内容是否侵权

讨论此问题,首要前提是训练模型数据来源的合法性,训练数据来自原创或经原权利授权或许可,且需在授权和许可范围内使用;其次,人工智能产品服务提供者应尽到合理的注意义务,采取措施避免侵权行为;最后,用户输入内容或指令合法合规未侵犯他人合法权利。生成内容使用也需注意使用的合规性。若满足前述条件,人工智能生成内容可最大限度规避风险,避免侵权,反之构成侵权。在司法实践中,广州互联网法院在全球首例涉及生成式人工智能AIGC平台的侵权案件(案号:(2024)粤0192民初113号)判决中认定“平台作为生成式人工智能服务提供者未尽合理注意义务,未采取措施避免侵权行为。被告未经许可,复制了案涉作品,侵犯了原告对案涉作品的复制权。另外,案涉生成图片部分保留了原作品的独创性表达,并在保留该独创性表达的基础上形成了新的特征。被告上述行为构成对案涉作品的改编。因此,被告未经许可,改编了案涉作品,侵犯了原告对案涉作品的改编权。”;北京互联网法院一审开庭宣判全国首例AI生成声音人格权侵权案,明确认定在具备可识别性的前提下,自然人声音权益的保护范围可及于AI生成声音,未经许可,使用原告声音构成侵权。

用户对人工智能产品生成内容

是否受著作权法保护

人工智能产品生成内容是否为“作品”:人工智能产品生成内容是否构成我国《著作权法》所保护的作品,学界存在较大争议。我国著作权法所称的作品,是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果,保护的是具有独创性的表达,而非思想或者创意本身,能够通过一定形式表现,且为智力成果。那么人工智能产品生成内容是否满足著作权法保护客体的要件?司法实践中已经确定生成内容构成作品,受著作权法保护。北京互联网法院(2023)京0491民初11279号判决中明确“原告希望画出一幅在黄昏的光线条件下具有摄影风格的美女特写,其随即在StableDiffusion模型中输入了提示词,提示词对“照片形式” “人物形象”“环境”“人物呈现方式”等进行明确,同时设置了相关参数,根据初步生成的图片,又增加了提示词、调整了参数,最终选择了一幅自己满意的图片。从原告构思涉案图片起,到最终选定涉案图片止,这整个过程来看,原告进行了一定的智力投入,比如设计人物的呈现方式、选择提示词、安排提示词的顺序、设置相关的参数、选定哪个图片符合预期等等。涉案图片体现了原告的智力投入,故涉案图片具备了“智力成果”要件。”从涉案图片本身来看,体现出了与在先作品存在可以识别的差异性。从涉案图片生成过程来看,原告通过提示词对人物及其呈现方式等画面元素进行了设计,通过参数对画面布局构图等进行了设置,体现了原告的选择和安排。另外,原告通过输入提示词、设置相关参数,获得了第一张图片后,继续增加提示词、修改参数,不断调整修正,最终获得涉案图片,这一调整修正过程体现了原告的审美选择和个性判断。在无相反证据的情况下,可以认定涉案图片由原告独立完成,体现出了原告的个性化表达,因此涉案图片具备“独创性”要件。涉案图片是以线条、色彩构成的有审美意义的平面造型艺术作品,属于美术作品,应受到著作权法的保护。武汉东湖高新区法院(2024)鄂0192知民初968号判决中明确“王某使用“某AI”软件生成的案涉图片与通常人们见到的照片、绘画无异,显然属于艺术领域,具有一定的表现形式,受到著作权法的保护。从案涉图片的呈现与王某上述创作过程的关联性来看,王某使用的关键词与画面的元素及效果对应,生成的图片和其创作活动之间具有一定的映射性。在王某设置调整关键词、参数、风格光影效果并挑选图片最终获得案涉图片的过程中,王某对生成作品具有一定程度的控制和预见,创作过程反映了王某的构思、创作技法、审美选择,体现了王某的个性化表达。故案涉图片凝结了王某的智力劳动成果,应予保护。王某为案涉图片的作者及著作权人,有权提起本案诉讼。”,从前述判决可以看出,人工智能生成内容在符合一定条件下可受著作权法保护,确认了人工智能生成的具有独创性的图片应当属于著作权法意义上的作品。


人工智能生成内容的权利归属

法律规定:我国著作权法第二条规定中国公民、法人或者非法人组织的作品,不论是否发表,依照本法享有著作权。第十一条规定著作权属于作者,本法另有规定的除外。创作作品的自然人是作者。由法人或者非法人组织主持,代表法人或者非法人组织意志创作,并由法人或者非法人组织承担责任的作品,法人或者非法人组织视为作者。第十二条 在作品上署名的自然人、法人或者非法人组织为作者,且该作品上存在相应权利,但有相反证明的除外。著作权法规定创作作品的作者享有完成作品的著作权。

司法实践:北京互联网法院(2023)京0491民初11279号判决中明确“原告是直接根据需要对涉案人工智能模型进行相关设置,并最终选定涉案图片的人,涉案图片是基于原告的智力投入直接产生,且体现出了原告的个性化表达,故原告是涉案图片的作者,享有涉案图片的著作权。”武汉东湖高新区法院(2024)鄂0192知民初968号判决明确“在判定权属问题时,需要考量创作者贡献是否占据图片主要特征的主导地位。本案中从创作活动和生成图片的呈现来看,原告输入的指令既包含了画面的元素、布局、风格、光影效果及技术参数等,具有较强的完整性和描述力,上述指令也均在生成的图片中一一体现,创作活动与生成图片形成了紧密的关联关系,并且最终的图片呈现了一定的审美价值,体现了原告的个性判断,应认定创作者对生成图片的贡献占据了主导作用,构成了原告的独创性表达。”,前述判决可知创作者对生成内容享有著作权。

平台《用户协议》约定:大部分平台在用户协议中约定“输入和输出内容”用户享有所有权;DeepSeek用户协议第4.2 条“根据适用法律和我们的条款,您对服务的输入和输出享有以下权利:(1) 您保留您提交的输入中的任何权利、所有权和利益(如有);(2) 我们将服务输出中的任何权利、所有权和利益(如有)转让给您。(3) 您可以将服务的输入和输出应用于广泛的使用案例,包括个人使用、学术研究、衍生产品开发、训练其他模型(如模型蒸馏)等。”豆包用户协议第8.1条“在你使用本软件及相关服务期间,你可以向本软件及相关服务提交文本、音频或其他内容或信息(合称“输入”),并接收响应你的输入而生成的内容(称“输出”)。在你和公司之间,在适用法律允许的范围内,你提供的输入的知识产权归属于你或者依法享有这些知识产权的权利人。公司不主张输出内容的所有权。如果输入和/或输出本身包含了公司享有知识产权或其他合法权益的内容,则前述输入和/或输出的相应权利仍由公司享有,不因包含在输出当中而改变其权属。”。openAI用户协议“内容的所有权。 在您和 OpenAI 之间,在适用法律允许的范围内,您 (a) 保留您对 Input 的所有权,并且 (b) 拥有输出。我们特此将我们在 Output 中和对 Output 的所有权利、所有权和利益(如果有)转让给您。”

综上,结合法律、司法实践、平台用户协议,可知创作者作为人工智能生成内容的作者,享有生成内容的著作权,有权行使相关权利,受法律保护。

来源:刘亚勇律师

评论列表(0)
暂无提问

发表提问 取消回复