紐約時報要求 OpenAI 和 Microsoft 為訓練數據支付費用

紐約時報控告 OpenAI 及其密切合作夥伴（兼投資者） Microsoft ，指控其以時報的內容訓練生成式 A.I. 模型，涉嫌侵犯版權法。

在這起訴訟中，紐約時報聲稱數百萬篇文章被用於訓練 AI 模型，包括 OpenAI 的 ChatGPT 和 Microsoft 的 Copilot，而這些行為未經其同意。紐約時報要求 OpenAI 和 Microsoft 「銷毀」包含違規材料的模型和訓練數據，並承擔與「非法複製和使用紐約時報獨特有價值作品」相關的「數十億美元的法定和實際損害」。

紐約時報的投訴書中寫道：「如果紐約時報和其他新聞機構無法產出並保護他們的獨立新聞，將會產生一個無法由任何計算機或 A.I. 填補的真空。新聞的產出將減少，而對社會的代價將是巨大的。」

在一份電子郵件聲明中，OpenAI 的發言人表示：「我們尊重內容創作者和所有者的權利，致力於與他們合作，確保他們從 A.I. 技術和新的收入模式中受益。我們與紐約時報的持續對話已經取得了積極和建設性的進展，因此對於這一發展感到驚訝和失望。我們希望能找到一種互利的合作方式，就像我們與許多其他出版商合作一樣。」

生成式 A.I. 模型通過學習示例來生成文章、代碼、電子郵件、新聞等內容，而 OpenAI 等供應商則從網絡上爬取數以億計的這些示例來擴充他們的訓練集。其中一些示例屬於公共領域，而其他示例則受到限制性許可證的保護，要求引用或特定形式的補償。

供應商主張公平使用原則為他們的網絡爬取行為提供了全面保護。版權持有者則持不同意見；數百家新聞機構現在使用代碼來防止 OpenAI、Google 和其他公司對其網站進行訓練數據的掃描。

供應商和新聞機構之間的衝突已導致越來越多的法律爭議，紐約時報的訴訟是其中最新的一起。

女演員莎拉·西爾弗曼（Sarah Silverman）於 7 月加入了兩起訴訟，指控 Meta 和 OpenAI「攝取」了西爾弗曼的回憶錄用於訓練他們的 AI 模型。在另一起訴訟中，包括喬納森·弗蘭森（Jonathan Franzen）和約翰·葛里沙姆（John Grisham）在內的數千名小說家聲稱，OpenAI未經他們的許可或知情使用他們的作品作為訓練數據。還有幾名程序員對 Microsoft 、OpenAI 和 GitHub 提起了一起長期訴訟，原因是 Copilot（一個由 A.I. 驅動的代碼生成工具）是使用他們受知識產權保護的代碼開發的。

雖然紐約時報不是首家因涉嫌侵犯版權而對生成式 A.I. 供應商提起訴訟的媒體機構，但它是迄今為止參與此類訴訟的最大型出版商之一，也是最早提出生成式 A.I. 模型的「幻覺」或虛構事實對其品牌可能造成損害的機構之一。

紐約時報的投訴書引用了幾個案例，其中 Microsoft 的 Bing Chat（現稱 Copilot），其背後是 OpenAI 的模型，提供了來自紐約時報的錯誤資訊，包括「十五種最有益於心臟健康的食物」的結果，其中有十二種在任何時報文章中都未提及。

紐約時報還指出，OpenAI 和 Microsoft 實際上正在利用紐約時報的作品建立新聞發佈商的競爭對手，通過提供通常無法在沒有訂閱的情況下獲得的資訊，這些資訊並不總是被引用，有時還被剝去紐約時報用於獲得佣金的聯盟鏈接。

正如紐約時報的投訴書所暗示的，生成式 A.I. 模型往往會重複訓練數據，例如幾乎逐字逐句地複製文章的結果。除了重複，OpenAI 至少在一次意外中使 ChatGPT 用戶繞過了付費新聞內容的付費牆。

投訴書稱：「被告試圖免費乘坐紐約時報在新聞事業上的巨額投資。」投訴書指責 OpenAI 和 Microsoft 「未經付費使用紐約時報的內容來創建可以替代紐約時報並將觀眾從中挖走的產品。」

這對新聞訂閱業務和出版商的網站流量產生的影響是一項與之相關的訴訟的核心。本月早些時候，出版商對 Google 提起的一起訴訟中，被告（包括紐約時報）辯稱 Google 的 GenAI 實驗，包括其 A.I. 驅動的 Bard ChatBot 和搜索生成體驗，通過反競爭手段吸走了出版商的內容、讀者和廣告收入。

出版商的主張是有根據的。《大西洋月刊》最近的一個模型發現，如果像 Google 這樣的搜尋引擎將 A.I. 整合到搜索中，它將在不需要點擊進入其網站的情況下，對用戶的查詢作出 75% 的回答。在 Google 訴訟中，出版商估計他們可能會損失高達 40% 的流量。

這並不意味着他們在法庭上會獲得成功。OSS Capital 的創始合夥人、知識產權事務顧問希瑟·米克（Heather Meeker）將紐約時報提供的重複示例與「使用文字處理器進行剪切和黏貼」相提並論。

________

按此即看更多：AI 人工智能新聞
按此即看更多：免費使用 ChatGPT-4 的 6 個方法
按此即看更多：5 個「香港」免費使用 ChatGPT-4 的方法

中國推出全新 vivo Y300 手機

Samsung Galaxy Book5 Pro 公開：搭載 Intel Lunar Lake 處理器，具備 Galaxy AI 和 Copilot+ 功能

iPhone SE 4 再次傳出將配備 48MP 主攝像頭和 12MP 自拍攝像頭的消息

Samsung S25 三部曲將支持 Qi2 無線充電功能

Samsung Galaxy XCover8 Pro 電池獲認證，容量提升至 4,350mAh

Meta Orion增強現實眼鏡可能會根據最新的Project Aria更新，獲得這三個令人驚嘆的科幻功能。

Meta Quest 3 新增 HDMI Link 應用程式，提升多功能性與連接選擇！

Vision Pro 模擬器重新帶回任天堂 Virtual Boy 的經典遊戲體驗

Disney+ 推出其為 Apple Vision Pro 設計的第五個沉浸式環境

新突破將串聯 OLED 技術應用於微型 OLED，為 Vision Pro 2 提供完美解決方案。

【教學】如何在 iPhone (iOS 18) 上設定 VPN

【VPN 比較】2024 年推薦安全 VPN（免費/付費）供應商

【教學】Cloudflare 的類 VPN 服務，可靠免費外仲有 iPhone / Android App

【評測】3 PIA VPN Pass 一年通行證 $250：街上就可以買到隱藏網絡行蹤？

【詳解】如何為 iPhone 選擇 VPN？私隱、無日誌政策、易用、速度，5 個 VPN 服務供應商推介

【評價】Lucky SIM↷csl $33 5GB 香港年卡，用來儲號碼？

【開箱評價】momax HARO PIN POP Find My 全球定位器：可以掛在背包上的追蹤器

【推介評價】日本電話卡 – B4Travel 雙 5G 網絡 5天 9GB，關東+關西最快有 123Mbps 速度

【實測推介】韓國電話卡 – 中國聯通 $60 8日 5GB 無限上網，可打電話但無聽電話

【售價】B4travel 韓國 9日 10GB 5G 無限上網卡，高速數據、無需實名登記，最新優惠售價 HK$ 118

紐約時報要求 OpenAI 和 Microsoft 為訓練數據支付費用

【優惠碼】SmarTone 寛頻即減 $480

【推介評價】日本電話卡 – B4Travel 雙 5G 網絡 5天 9GB，關東+關西最快有 123Mbps 速度

【推薦】摺疊手機 2023 年：優點、缺點、規格比較，價錢最值得買邊款？

【說明】iPhone 16 傳聞整理：AI無得用？售價更貴、屏幕尺寸更大，全新顏色

Mac 用家必備的 4 個最佳瀏覽器：不用 Safari 還有這些選擇

【開箱評測】小米 Poco X6 Pro 手機：價錢是關鍵，外型效能均出眾

【開箱評價】小米 Xiaomi 14T Pro：出色的相機表現，滿足各種拍攝需求

電話卡

比較系列

教學 101

推薦內容

關於我們