纽约时报要求 OpenAI 和 Microsoft 为训练数据支付费用

,LogoTechritual 香港科技电脑资讯网站,,LogoTechritual 香港科技电脑资讯网站,,纽约时报要求 OpenAI 和 Microsoft 为训练数据支付费用,28/12/2023,十斗 十斗,187,,

纽约时报控告 OpenAI 及其密切合作夥伴(兼投资者) Microsoft ,指控其以时报的内容训练生成式 A.I. 模型,涉嫌侵犯版权法。

在这起诉讼中,纽约时报声称数百万篇文章被用於训练 AI 模型,包括 OpenAI 的 ChatGPT 和 Microsoft 的 Copilot,而这些行为未经其同意。纽约时报要求 OpenAI 和 Microsoft 「销毁」包含违规材料的模型和训练数据,并承担与「非法复制和使用纽约时报独特有价值作品」相关的「数十亿美元的法定和实际损害」。

纽约时报的投诉书中写道:「如果纽约时报和其他新闻机构无法产出并保护他们的独立新闻,将会产生一个无法由任何计算机或 A.I. 填补的真空。新闻的产出将减少,而对社会的代价将是巨大的。」

在一份电子邮件声明中,OpenAI 的发言人表示:「我们尊重内容创作者和所有者的权利,致力於与他们合作,确保他们从 A.I. 技术和新的收入模式中受益。我们与纽约时报的持续对话已经取得了积极和建设性的进展,因此对於这一发展感到惊讶和失望。我们希望能找到一种互利的合作方式,就像我们与许多其他出版商合作一样。」

生成式 A.I. 模型通过学习示例来生成文章、代码、电子邮件、新闻等内容,而 OpenAI 等供应商则从网络上爬取数以亿计的这些示例来扩充他们的训练集。其中一些示例属於公共领域,而其他示例则受到限制性许可证的保护,要求引用或特定形式的补偿。

供应商主张公平使用原则为他们的网络爬取行为提供了全面保护。版权持有者则持不同意见;数百家新闻机构现在使用代码来防止 OpenAI、Google 和其他公司对其网站进行训练数据的扫描。

供应商和新闻机构之间的冲突已导致越来越多的法律争议,纽约时报的诉讼是其中最新的一起。

女演员莎拉·西尔弗曼(Sarah Silverman)於 7 月加入了两起诉讼,指控 Meta 和 OpenAI「摄取」了西尔弗曼的回忆录用於训练他们的 AI 模型。在另一起诉讼中,包括乔纳森·弗兰森(Jonathan Franzen)和约翰·葛里沙姆(John Grisham)在内的数千名小说家声称,OpenAI未经他们的许可或知情使用他们的作品作为训练数据。还有几名程序员对 Microsoft 、OpenAI 和 GitHub 提起了一起长期诉讼,原因是 Copilot(一个由 A.I. 驱动的代码生成工具)是使用他们受知识产权保护的代码开发的。

虽然纽约时报不是首家因涉嫌侵犯版权而对生成式 A.I. 供应商提起诉讼的媒体机构,但它是迄今为止参与此类诉讼的最大型出版商之一,也是最早提出生成式 A.I. 模型的「幻觉」或虚构事实对其品牌可能造成损害的机构之一。

纽约时报的投诉书引用了几个案例,其中 Microsoft 的 Bing Chat(现称 Copilot),其背後是 OpenAI 的模型,提供了来自纽约时报的错误资讯,包括「十五种最有益於心脏健康的食物」的结果,其中有十二种在任何时报文章中都未提及。

纽约时报还指出,OpenAI 和 Microsoft 实际上正在利用纽约时报的作品建立新闻发布商的竞争对手,通过提供通常无法在没有订阅的情况下获得的资讯,这些资讯并不总是被引用,有时还被剥去纽约时报用於获得佣金的联盟链接。

正如纽约时报的投诉书所暗示的,生成式 A.I. 模型往往会重复训练数据,例如几乎逐字逐句地复制文章的结果。除了重复,OpenAI 至少在一次意外中使 ChatGPT 用户绕过了付费新闻内容的付费墙。

投诉书称:「被告试图免费乘坐纽约时报在新闻事业上的巨额投资。」投诉书指责 OpenAI 和 Microsoft 「未经付费使用纽约时报的内容来创建可以替代纽约时报并将观众从中挖走的产品。」

这对新闻订阅业务和出版商的网站流量产生的影响是一项与之相关的诉讼的核心。本月早些时候,出版商对 Google 提起的一起诉讼中,被告(包括纽约时报)辩称 Google 的 GenAI 实验,包括其 A.I. 驱动的 Bard ChatBot 和搜索生成体验,通过反竞争手段吸走了出版商的内容、读者和广告收入。

出版商的主张是有根据的。《大西洋月刊》最近的一个模型发现,如果像 Google 这样的搜寻引擎将 A.I. 整合到搜索中,它将在不需要点击进入其网站的情况下,对用户的查询作出 75% 的回答。在 Google 诉讼中,出版商估计他们可能会损失高达 40% 的流量。

这并不意味着他们在法庭上会获得成功。OSS Capital 的创始合夥人、知识产权事务顾问希瑟·米克(Heather Meeker)将纽约时报提供的重复示例与「使用文字处理器进行剪切和黏贴」相提并论。

________

按此即看更多:AI 人工智能 新闻
按此即看更多:免费使用 ChatGPT-4 的 6 个方法
按此即看更多:5 个「香港」免费使用 ChatGPT-4 的方法

,LogoTechritual 香港River

Leave a Reply

Your email address will not be published. Required fields are marked *