AI攪亂亞馬遜電子書
作者|畢安娣 來源|字母榜(ID:wujicaijing)
如果你是一個(gè)網(wǎng)上沖浪老手,一定還記得2000年左右在門戶網(wǎng)站瀏覽新聞的體驗(yàn):
你需要從一堆花花綠綠的廣告當(dāng)中識(shí)別真正的內(nèi)容,并精準(zhǔn)點(diǎn)擊。看得不準(zhǔn),或者點(diǎn)得不準(zhǔn),都會(huì)讓你被即刻送往另一個(gè)不想去的網(wǎng)站。可以說,識(shí)別垃圾信息、避開它們,是彼時(shí)網(wǎng)上沖浪的必備技能。
如今,AI的發(fā)展讓人夢(mèng)回千禧年,在亞馬遜搜索電子書,要時(shí)刻警惕被AI生成的垃圾書騙。
食之無味就算了,有的垃圾書甚至想置人于死地。
比如在亞馬遜上公開出售的電子書《野生蘑菇烹飪書:從森林到餐盤,野生蘑菇烹飪完全指南》《西南地區(qū)的頂級(jí)蘑菇野外指南》,書里明晃晃寫著用“氣味和味道”識(shí)別不同的蘑菇。
聞一聞或者嘗一嘗,就能知道蘑菇的種類啦!這種話,隨便拉來一個(gè)云南人都能鑒別為一派胡言。正如蘑菇界的名言所說:所有蘑菇都是可食用的,不過有些蘑菇只能食用一次。
相關(guān)專家在接受《衛(wèi)報(bào)》采訪的時(shí)候幾乎發(fā)出尖銳爆鳴:“這似乎在鼓勵(lì)人們以品嘗作為辨別方法。絕對(duì)不應(yīng)該這么做。”
書中提到的一些蘑菇則“很刑”。比如上述烹飪指南中提到的“獅鬃菌”,雖然是可食用的,但在英國(guó)是受保護(hù)的物種。別問,問就是獅鬃菌嘗起來像縫紉機(jī)的味道。
根據(jù)專做AI文本識(shí)別的公司Originality.ai的檢測(cè),這兩本書的樣本中人工智能檢測(cè)得分是100%,這意味著系統(tǒng)很自信這些書由如ChatGPT這樣的聊天機(jī)器人編寫。
這些書被報(bào)道之后,紐約真菌學(xué)會(huì)都出面發(fā)X(前Twitter),呼吁人們“請(qǐng)只購(gòu)買已知作者和美食家的書籍,這可能關(guān)系到生死”。
我們?cè)谌ツ?月就曾經(jīng)報(bào)道過一些人開始通過ChatGPT等工具撰寫書籍,并放到亞馬遜等網(wǎng)站上售賣的現(xiàn)象。如今一年多過去,AI高速發(fā)展,亞馬遜顯然還沒有找到有力的方法杜絕這一現(xiàn)象,這家老牌電子書網(wǎng)站正在被AI攪亂。
一
讓我們來捋一下時(shí)間線。
2022年11月,ChatGPT橫空出世。僅僅幾個(gè)月之后,亞馬遜上就開始出現(xiàn)一些疑似由AI撰寫的書籍。除了內(nèi)容和封面都粗制濫造之外,最明顯的反常信號(hào)是一個(gè)作者一天出版數(shù)本書。
彼時(shí)在YouTube上已經(jīng)開始有博主在視頻教學(xué)如何用ChatGPT寫書并在亞馬遜上售賣。
從2023年年中開始,包括VICE、WIRED(《連線》)等在內(nèi)的媒體開始報(bào)道“AI圖書正在淹沒亞馬遜”的現(xiàn)象。
根據(jù)獨(dú)立作家凱特林·林奇(Caitlyn Lynch)2023年6月的統(tǒng)計(jì),彼時(shí)亞馬遜上“青少年浪漫”的類型下,暢銷排行榜的前100本電子書中,有約八成都是語無倫次的,看起來很像是AI生成的。
一直到如今,還不斷有作者站出來公開談?wù)揂I圖書對(duì)他們個(gè)人IP的盜用與模仿。
也就是說,除了某些類型成為AI圖書的重災(zāi)區(qū)之外,一些作者——尤其是有名氣的作者——會(huì)被“影子圖書”蹭流量。這種情況大多發(fā)生在新書發(fā)售的黃金周期內(nèi),和作者相關(guān)的傳記、與新書高度相似的仿品大量出現(xiàn),試圖在宣傳期蒙騙不明真相的用戶,竊取流量。
一個(gè)新鮮的例子來自知名科技記者卡拉·斯威舍(Kara Swisher)。
卡拉在科技報(bào)道界德高望重,今年已經(jīng)62歲,幾乎把科技界大佬都采訪了個(gè)遍。包括但不限于數(shù)次深度對(duì)話史蒂夫·喬布斯、埃隆·馬斯克、馬克·扎克伯格等。
今年初,卡拉出版了一本個(gè)人回憶錄《燃燒的書(Burn Book)》。但她很快就發(fā)現(xiàn),當(dāng)她在亞馬遜檢索自己時(shí),除了自己的新書,還出現(xiàn)了一些奇怪的東西。比如《卡拉·斯威舍:硅谷的斗牛犬》《卡拉·斯威舍:她如何成為硅谷最具影響力的記者》等,其中一本書的作者在一個(gè)月里就“寫”了四本傳記。
在卡拉看來,這些明顯是竊取新書流量的AI圖書,氣憤的她甚至給亞馬遜CEO安迪·杰西(Andy Jassy)發(fā)了一條短信:“這**是怎么回事?你在浪費(fèi)我的錢。”
美國(guó)作家協(xié)會(huì)的CEO表示,亞馬遜上的欺詐書籍其實(shí)一直都是一個(gè)問題,但最近幾個(gè)月這個(gè)問題愈發(fā)尖銳,可能是因?yàn)樵贏I幫助下造書成本降低:“每一本新書似乎都有配套的各種書出現(xiàn),試圖竊取銷售額。”
圖書“盜竊”不僅發(fā)生在新書作者身上。另一位作家梅勒妮·米切爾(Melanle Mitchell)在2019年發(fā)表《人工智能:思考人類指南》一書,最近卻發(fā)現(xiàn)在亞馬遜搜索這本書時(shí),出現(xiàn)了去年9月發(fā)表的同名電子書。
這本同名電子書只有45頁(yè),用坑坑巴巴、笨拙的語言重復(fù)米切爾的觀點(diǎn),看起來是一部寫得不怎么樣的摘要。而該書作者在亞馬遜上沒有頭像,也沒有簡(jiǎn)介,名下卻有幾十本類似的書,都是對(duì)其他書籍的總結(jié)式模仿。
深度偽造檢測(cè)公司Reality Defender幫米切爾檢測(cè)了一下,果然那本同名電子書有99%的可能是由AI生成的。
Reality Defender還順便檢測(cè)了一下“AI教母”李飛飛著作《我眼中的世界》在亞馬遜上的模仿者。與米切爾的模仿書不同,在亞馬遜搜索李飛飛《我眼中的世界》,會(huì)出現(xiàn)十幾本寫明自己是“摘要”的電子書。經(jīng)檢測(cè),這些書也大概率是AI生成的。不過雖然寫著自己是“摘要”,實(shí)際內(nèi)容則更像是用AI重寫了一遍原作,就像是“XXX書·兒童版”。
在《連線》雜志聯(lián)系李飛飛,告知她這一現(xiàn)象后,她回復(fù)了一個(gè)“腦袋爆炸”的emoji表情,顯然在此之前對(duì)有人在偷偷用AI模仿自己的書一無所知。
二
亞馬遜也并不是什么都沒做,但動(dòng)作顯得有些遲緩,效果也有限。
去年8月,簡(jiǎn)·弗里德曼(Jan Fridman)向亞馬遜和美國(guó)“豆瓣”Goodreads開炮。弗里德曼是出版業(yè)的專家,曾在多家知名出版公司擔(dān)任高管,也有自己的博客,時(shí)不時(shí)發(fā)布對(duì)出版業(yè)的見解和實(shí)用建議。
她在自己的博客發(fā)表文章《我寧愿看到我的書被盜版,也不愿意看到這個(gè)》,表示在亞馬遜上有數(shù)本署名Jane Fridman但與她無關(guān)的書籍,更要命的是美國(guó)“豆瓣”Goodreads還將這些書籍放到了她的相關(guān)頁(yè)面。
也就是說,一個(gè)不熟悉弗里德曼的讀者,很有可能在對(duì)照了亞馬遜和Goodreads之后,認(rèn)為那些仿冒品出自她之手。而這些作品內(nèi)容拙劣,足以對(duì)弗里德曼造成名譽(yù)上的打擊。
更令弗里德曼不悅的是,當(dāng)她聯(lián)系亞馬遜和Goodreads,試圖讓其下架仿冒書籍的時(shí)候,遭到了兩個(gè)平臺(tái)的拒絕。亞馬遜要求她提供相關(guān)的商標(biāo)注冊(cè)證明,而弗里德曼被冒用的實(shí)際上是自己的名字,而她并未對(duì)自己的名字進(jìn)行商標(biāo)注冊(cè)(誰會(huì)想到去注冊(cè)自己的名字呢)。
有意思的是,在弗里德曼發(fā)表博文公開吐槽這件事后不久,亞馬遜和Goodreads就悉數(shù)移除了仿冒作品。
弗里德曼感嘆:“我敢肯定,這很大程度上拜賜于我在寫作和出版界的知名度與名譽(yù)。如果這些情況發(fā)生在比較小的作者身上,他們(平臺(tái))會(huì)怎么做?”
弗里德曼的發(fā)聲引發(fā)了一連串的反應(yīng)。先是美國(guó)作家協(xié)會(huì)宣布會(huì)為作者們提供幫助,而后美國(guó)聯(lián)邦貿(mào)易委員會(huì)(FTC)也發(fā)表了一篇文章,涉及生成性人工智能和圖書銷售,表明他們正在密切關(guān)注相關(guān)問題。
去年9月,在弗里德曼發(fā)表博文后一個(gè)月,亞馬遜開始打擊AI圖書。它修改了規(guī)則,將自助出版(Kindle Direct Program,下稱KDP)同作者每日上傳書籍的數(shù)量從無限制更改為最多三本。
KDP本就是AI圖書的重災(zāi)區(qū)。通過KDP,作者可以繞過傳統(tǒng)出版途徑,直接將作品發(fā)表在亞馬遜上并進(jìn)行銷售。理論上,亞馬遜一直都未禁止AI生成的文本銷售,而是要求作者標(biāo)明,且不能產(chǎn)生危害。
亞馬遜還聲明,正在積極監(jiān)測(cè)AI的發(fā)展以及隨后對(duì)閱讀、寫作和出版的影響。
但從今年還在不斷出現(xiàn)作家新書被AI截胡的事件來看,亞馬遜顯然做得還不夠好。
三
一個(gè)奇怪的現(xiàn)象是,雖然亞馬遜上充斥著疑似AI生成的圖書,但大部分此類圖書并沒有什么銷量。
究竟是什么在推波助瀾?
人們對(duì)AI工具的確愈發(fā)熟悉,這也就促成了一些人有了想要通過AI寫書賺錢的想法。
一個(gè)有點(diǎn)驚人的數(shù)字是,Statista報(bào)告說,23%的美國(guó)作者在作品中使用了AI,近50%的受訪作者表示他們?cè)肁I作語法工具,還有10%的受訪者表示AI生成了他們的全部文稿。
知名媒體Vox指出,真正依靠“AI圖書”賺錢的,很可能不是那些把AI圖書放在亞馬遜上出售的“作者”,而是開課教授“如何用AI圖書賺錢”的人。
亞馬遜的自出版業(yè)務(wù)KDP于2007年推出,早在2010年前后,關(guān)于如何利用自出版賺錢的課程如“自助出版革命”就如雨后春筍般冒出來。
在學(xué)習(xí)“自助出版革命”的若干學(xué)生中,有一對(duì)米科爾森(Mikkelsen)雙胞胎兄弟做得很成功,他們自出版了一本又一本垃圾書,還創(chuàng)新地利用谷歌翻譯制作外文書籍,進(jìn)一步擴(kuò)大了銷路,收入一度達(dá)到百萬美元。但最終,由于買家投訴,他們的KDP賬戶被封鎖,于是二人創(chuàng)業(yè),也開始兜售相關(guān)課程。
有意思的是,他們的課程名稱一路從“有聲書影響學(xué)院”“出版生活”,到如今的“AI出版學(xué)院”。兄弟倆的課程原價(jià)6000美元,但往往會(huì)“限時(shí)打折”到2000美元左右。
上過“AI出版學(xué)院”課程的學(xué)生透露,2000美元只是敲門費(fèi)。一旦開始上課,就會(huì)發(fā)現(xiàn)后續(xù)幾乎所有環(huán)節(jié)都會(huì)交費(fèi)。首先,兄弟倆會(huì)收取AI撰寫大綱的AI服務(wù)費(fèi),而后是人工代寫費(fèi)用(接活的代寫公司也是由兄弟倆的學(xué)生所有),接著還會(huì)有有聲書制作費(fèi)用,以及刷好評(píng)的費(fèi)用。
如果學(xué)生想要完整地跟完整個(gè)課程,費(fèi)用會(huì)從最初的2000美元激增到7800美元。
雖然交學(xué)費(fèi)前,“AI出版學(xué)院”承諾不滿意就會(huì)退款,但當(dāng)學(xué)生真的要退款時(shí),學(xué)院要求其提供完成了全部課程、出版了書籍并沒能把學(xué)費(fèi)賺回來的證明。
根據(jù)Inc.的一篇報(bào)道,米科爾森兄弟的公司收入從2019年的30萬美元,已經(jīng)激增到了2022年的5000萬美元。截至目前,他們的公司仍然運(yùn)營(yíng)著(畢竟好像的確沒有違法)。
AI圖書攪亂亞馬遜,“壞”的卻不是AI,而是背后無視規(guī)則無視道德的那批AI用戶。
將視角拉遠(yuǎn),我們正處在AI內(nèi)容與人類內(nèi)容混雜的時(shí)代,一場(chǎng)“AI狼人殺”時(shí)刻在互聯(lián)網(wǎng)中上演。根據(jù)互聯(lián)網(wǎng)安全公司Imperva的報(bào)告,2023年,全球互聯(lián)網(wǎng)流量中有49.6%來自機(jī)器人,而在2019年,這個(gè)數(shù)字還只有37.2%。
高效、準(zhǔn)確、全面地甄別AI內(nèi)容已經(jīng)成為一個(gè)亟待解決的難題。
編者按:本文轉(zhuǎn)載自微信公眾號(hào):字母榜(ID:wujicaijing),作者:畢安娣
前瞻經(jīng)濟(jì)學(xué)人
專注于中國(guó)各行業(yè)市場(chǎng)分析、未來發(fā)展趨勢(shì)等。掃一掃立即關(guān)注。