- OpenAI正與數(shù)十家出版商洽談內(nèi)容許可 年費(fèi)用低至100萬(wàn)美元
- 2024年01月08日來(lái)源:澎湃新聞
提要:·OpenAI表示,正在與數(shù)十家出版商洽談達(dá)成文章授權(quán)協(xié)議。消息人士稱(chēng),OpenAI每年向一些媒體公司提供100萬(wàn)至500萬(wàn)美元的費(fèi)用以獲得受版權(quán)保護(hù)的新聞文章,訓(xùn)練其大語(yǔ)言模型。
·OpenAI表示,正在與數(shù)十家出版商洽談達(dá)成文章授權(quán)協(xié)議。消息人士稱(chēng),OpenAI每年向一些媒體公司提供100萬(wàn)至500萬(wàn)美元的費(fèi)用以獲得受版權(quán)保護(hù)的新聞文章,訓(xùn)練其大語(yǔ)言模型。
1月5日,美國(guó)人工智能公司OpenAI表示,正在與數(shù)十家出版商洽談達(dá)成文章授權(quán)協(xié)議,以獲取內(nèi)容來(lái)訓(xùn)練其人工智能模型。
“我們正在與許多出版商進(jìn)行多次談判和討論。他們很活躍,非常積極,目前進(jìn)展順利。”O(jiān)penAI知識(shí)產(chǎn)權(quán)和內(nèi)容主管湯姆·羅賓(Tom Rubin)在接受彭博社采訪時(shí)表示,“你看到了已經(jīng)宣布的交易,未來(lái)還會(huì)有更多。”
OpenAI最近與新聞出版巨頭施普林格出版集團(tuán) (Axel Springer) 簽署了一項(xiàng)多年期許可協(xié)議,這是該公司與此類(lèi)出版商的首次合作。施普林格是一家總部位于德國(guó)的跨國(guó)大眾媒體公司,旗下?lián)碛蠦usiness Insider和Politico等品牌。該交易的財(cái)務(wù)條款從未公開(kāi),但據(jù)The Information援引OpenAI兩位高管的消息稱(chēng),交易金額在數(shù)千萬(wàn)美元左右。
7月,OpenAI宣布與美聯(lián)社達(dá)成一項(xiàng)類(lèi)似協(xié)議,金額未公開(kāi)。這些交易對(duì)于OpenAI的未來(lái)至關(guān)重要,因?yàn)樗谄胶鈽?gòu)建模型所需數(shù)據(jù)的需求與對(duì)數(shù)據(jù)來(lái)源日益嚴(yán)格的審查。
實(shí)際上,這些交易似乎與前幾年類(lèi)似。谷歌在2020年宣布將總共投資10億美元與新聞機(jī)構(gòu)合作。在新法律的壓力下,谷歌最近還同意每年向加拿大出版商支付總計(jì)1億美元,以換取其文章鏈接。
隨著新聞出版商與人工智能公司簽訂協(xié)議,用新聞文章訓(xùn)練其模型,OpenAI等企業(yè)愿意為受版權(quán)保護(hù)信息支付的價(jià)格逐漸浮出水面。The Information援引匿名消息人士稱(chēng),OpenAI每年向一些媒體公司提供100萬(wàn)至500萬(wàn)美元的費(fèi)用,以使用其新聞文章用于訓(xùn)練大型語(yǔ)言模型。即使對(duì)于小型出版商來(lái)說(shuō),這個(gè)數(shù)額也很小,這可能會(huì)讓OpenAI難以達(dá)成交易。
與此同時(shí),蘋(píng)果公司也正在參與開(kāi)發(fā)生成式人工智能的競(jìng)賽,并與擁有《Vogue》和《紐約客》的康迪納仕(Condnast)、擁有Daily Beast的NBC新聞和IAC等出版商簽訂了價(jià)值約5000萬(wàn)美元的協(xié)議。
這些行動(dòng)背后的邏輯都在于,當(dāng)今大型語(yǔ)言模型訓(xùn)練的大量數(shù)據(jù)資源來(lái)自于互聯(lián)網(wǎng)。然而就訓(xùn)練生成式人工智能而言,似乎已經(jīng)難有更多的免費(fèi)午餐。
一方面,《紐約時(shí)報(bào)》、CNN、路透社和The Verge的母公司Vox Media最近阻止了OpenAI的GPT爬蟲(chóng)訪問(wèn)數(shù)據(jù)。另一方面,一些組織認(rèn)為基于其數(shù)據(jù)進(jìn)行訓(xùn)練構(gòu)成版權(quán)侵權(quán)。
最近,《紐約時(shí)報(bào)》在美國(guó)聯(lián)邦法院起訴OpenAI和微軟,指控這兩家科技公司非法使用“數(shù)百萬(wàn)篇”受《紐約時(shí)報(bào)》版權(quán)保護(hù)的文章,幫助開(kāi)發(fā)ChatGPT和必應(yīng)等工具背后的人工智能模型。這是一系列訴訟中最新的一起,也是關(guān)注度最高的一起,這些訴訟指控各種科技和人工智能公司侵犯了媒體公司、攝影網(wǎng)站、圖書(shū)作者和藝術(shù)家的知識(shí)產(chǎn)權(quán)。
一些法律專(zhuān)家表示,這些案件加在一起,有可能動(dòng)搖蓬勃發(fā)展的生成式人工智能行業(yè)的基礎(chǔ),但它們也可能落空。這是因?yàn)榭萍脊究赡軙?huì)嚴(yán)重依賴(lài)一個(gè)過(guò)去對(duì)它們很有幫助的法律概念:“合理使用”原則。
從廣義上講,版權(quán)法區(qū)分了逐字抄襲別人的作品和“重新混合”或?qū)⑵溆糜谛碌摹?chuàng)造性的用途,前者通常屬于非法。康奈爾大學(xué)數(shù)字和信息法教授詹姆斯·格里梅爾曼(James Grimmelmann)在接受《華盛頓郵報(bào)》采訪時(shí)表示,人工智能系統(tǒng)令人困惑的是,在這種情況下,它們似乎兩者都在做。
OpenAI和微軟已經(jīng)在進(jìn)行類(lèi)似的辯護(hù)。去年11月,OpenAI在提交給美國(guó)版權(quán)局的一份文件中寫(xiě)道:“我們認(rèn)為,人工智能模型的訓(xùn)練符合合理使用的條件,完全符合現(xiàn)有的先例,即技術(shù)創(chuàng)新者以變革性方式使用受版權(quán)保護(hù)的材料,這完全符合版權(quán)法。”
格里梅爾曼則表示,生成式人工智能代表了“這一重大的技術(shù)變革,它可以制作任何東西的混合版本”。“挑戰(zhàn)在于,這些模型還可以明目張膽地記住它們訓(xùn)練過(guò)的作品,并經(jīng)常復(fù)制出幾乎一模一樣的作品。”他說(shuō),這是“傳統(tǒng)上版權(quán)法禁止的核心內(nèi)容”。
《紐約時(shí)報(bào)》表示:“在不付費(fèi)的情況下使用其內(nèi)容進(jìn)行創(chuàng)造以替代《紐約時(shí)報(bào)》并搶走觀眾的產(chǎn)品,并沒(méi)有什么‘變革性’。”其總法律顧問(wèn)黛安·布雷頓(Diane Brayton)在一份內(nèi)部備忘錄中告訴員工,該報(bào)認(rèn)識(shí)到生成式人工智能在新聞業(yè)的潛力,但“使用我們的工作來(lái)創(chuàng)建生成式人工智能工具必須獲得許可和反映該工作公平價(jià)值的協(xié)議,正如法律規(guī)定的那樣。”
版權(quán)及免責(zé)聲明:
1. 任何單位或個(gè)人認(rèn)為南方企業(yè)新聞網(wǎng)的內(nèi)容可能涉嫌侵犯其合法權(quán)益,應(yīng)及時(shí)向南方企業(yè)新聞網(wǎng)書(shū)面反饋,并提供相關(guān)證明材料和理由,本網(wǎng)站在收到上述文件并審核后,會(huì)采取相應(yīng)處理措施。
2. 南方企業(yè)新聞網(wǎng)對(duì)于任何包含、經(jīng)由鏈接、下載或其它途徑所獲得的有關(guān)本網(wǎng)站的任何內(nèi)容、信息或廣告,不聲明或保證其正確性或可靠性。用戶(hù)自行承擔(dān)使用本網(wǎng)站的風(fēng)險(xiǎn)。
3. 如因版權(quán)和其它問(wèn)題需要同本網(wǎng)聯(lián)系的,請(qǐng)?jiān)谖恼驴l(fā)后30日內(nèi)進(jìn)行。聯(lián)系電話(huà):01083834755 郵箱:news@senn.com.cn