91无码视频一区|蜜臀福利在线观看|日韩一极黄色视频|色欲人妻少妇Av一区二区|婷婷香蕉视频欧美三级片黄色|一级A片刺激高潮|国产精品污污久久|日韩黄色精品日韩久久综合网|中国一级片电影在线|超碰乱码久久久免费

維基百科啟動AI寫作清理行動:終結(jié)互聯(lián)網(wǎng)的AI空洞文風(fēng)

2025-11-26

如今的互聯(lián)網(wǎng)上,越來越多的文字彌漫著一股「AI腔」。風(fēng)景永遠(yuǎn)是驚艷的,事件永遠(yuǎn)是關(guān)鍵的,語言被打磨成千篇一律的光滑模板。而維基百科的編輯們在日復(fù)一日的內(nèi)容巡查中最先察覺到了這種異樣,并悄然發(fā)起了一場針對AI生成空洞內(nèi)容的清理行動。



現(xiàn)在網(wǎng)上的很多句子,仿佛出自同一個流水線模板。


風(fēng)景總是用「breathtaking」形容,建筑永遠(yuǎn)被冠上「modern」,隨便一件事都要被定義為「標(biāo)志著一個關(guān)鍵時刻」。


這些話語聽起來完美無瑕,卻輕飄飄地沒有分量。讀得多了,人們甚至?xí)械揭环N莫名的恍惚。


維基百科的編輯們早已對這種類似「廣告腔」的表達(dá)感到厭煩,于是一場清理行動就此展開。


他們在校對大量新增內(nèi)容后發(fā)現(xiàn),最熱衷于說場面話的,竟然不是人類作者,而是AI生成的文本。


就這樣,一本既特別又實用的《AI文風(fēng)識別手冊》,在無數(shù)次的刪改實踐中被編撰出來。


模板化語言充斥的互聯(lián)網(wǎng)


互聯(lián)網(wǎng)的語言風(fēng)格正變得越來越整齊劃一,而維基百科最早察覺到了這種「不對勁的味道」。


每天都有成千上萬的新內(nèi)容被添加到維基百科的條目里,編輯們在巡查過程中逐漸發(fā)現(xiàn):不少新增段落讀起來流暢順滑,但細(xì)品之下卻充滿了套話。


隨著編輯們將這些可疑段落匯總分析,真相也逐漸浮出水面:


來源模糊、論據(jù)空洞、表達(dá)異常統(tǒng)一——這些特征都指向同一個可能性:越來越多的新增內(nèi)容是由AI生成的。



為了防止百科全書被這種空洞的句子「掏空」,一群志愿者在2023年發(fā)起了「WikiProject AI Cleanup」項目。



項目鏈接:https://en.wikipedia.org/wiki/Wikipedia:WikiProject_AI_Cleanup


他們系統(tǒng)地記錄這些異常的寫作模式,試圖找出AI生成內(nèi)容的蛛絲馬跡,以及那些看似正常卻經(jīng)不起驗證的句子。


維基編輯率先捕捉到「異常信號」


清理行動之初,編輯們就發(fā)現(xiàn):AI檢測工具并不可靠。


真正有效的,是他們在多年內(nèi)容巡查中練就的「語感」。


AI生成的段落表面看似正常,但仔細(xì)觀察會發(fā)現(xiàn)三種明顯的痕跡。


第一種是反復(fù)強調(diào)事物的「重要性」,卻不提供任何現(xiàn)實案例支撐。


AI生成的內(nèi)容常常用宏大的表述來描述主題,比如「a pivotal moment」(關(guān)鍵時刻)、「a broader movement」(廣泛運動)。


但涉及具體細(xì)節(jié)時,既沒有年份、來源,也沒有可查證的材料。這種寫法在強調(diào)真實性的百科語境中顯得格外突兀。


第二種是在句尾使用現(xiàn)在分詞結(jié)構(gòu)。


像「emphasizing…」「reflecting…」「highlighting…」這類結(jié)尾,是目前最明顯的「AI痕跡」。


TechCrunch的作者在報道中也指出:


這類現(xiàn)在分詞是區(qū)分AI文風(fēng)的關(guān)鍵線索之一。


第三種是頻繁使用互聯(lián)網(wǎng)式的「營銷形容詞」?!竍reathtaking」「modern」「renowned」「scenic」等詞匯在廣告中很常見,但在百科全書中使用則極不恰當(dāng)。


維基編輯遇到這類描述時會立即核查來源,結(jié)果往往找不到對應(yīng)的證據(jù)。


后來,這些規(guī)律被整理成《AI寫作識別特征》手冊。



鏈接:https://en.wikipedia.org/wiki/Wikipedia%3ASigns_of_AI_writing?utm_source


這本手冊更像是一份經(jīng)驗總結(jié),記錄了編輯們遇到的問題句式,方便更多人參與清理工作。


AI文風(fēng)的根源:語料庫的影響


當(dāng)編輯們整理出這些可疑句式后,一個問題也變得清晰起來:AI之所以會生成這樣的內(nèi)容,根源在于其訓(xùn)練所用的人類語料。


也就是說,AI從哪里學(xué)習(xí)語言,就會輸出什么樣的語言。


大型語言模型的訓(xùn)練數(shù)據(jù)涵蓋了整個互聯(lián)網(wǎng)的內(nèi)容,包括新聞稿、SEO軟文、宣傳冊和社交平臺內(nèi)容等。


而這些內(nèi)容中最常見的表達(dá),正是那些宏大卻空泛、形容詞夸張卻缺乏事實、評價多于證據(jù)的寫法。



維基百科將這類現(xiàn)象稱為:「模糊贊美」和「營銷語言」。


換句話說,AI并非故意使用「公關(guān)腔」,而是這類語料在互聯(lián)網(wǎng)上最容易獲取。


這也解釋了為什么「夸大重要性」「-ing結(jié)尾」「廣告式形容詞」會頻繁出現(xiàn)——這些是模型在海量語料中最常接觸、最容易復(fù)制,且最缺乏上下文約束的句式。



維基百科的解決方案非常務(wù)實。他們知道無法完全杜絕AI生成內(nèi)容,于是將重點放在了「證據(jù)鏈」上。


他們要求內(nèi)容必須注明來源、核查鏈接、追溯出處。


這一點在《WikiProject AI Cleanup》的流程說明中寫得很清楚:


凡是出現(xiàn)評價性語言、缺乏具體事實,或看上去「像模型生成」的內(nèi)容,編輯可以先貼上「需要引用」的模板。


如果作者無法補充來源,這段內(nèi)容就會被移至討論頁,必要時進(jìn)入快速刪除程序。


這一整套流程相當(dāng)于維基百科的「免疫系統(tǒng)」:去除評價性形容詞,讓句子必須基于事實。


凡是經(jīng)不起驗證的內(nèi)容,都會被自動攔截。對于一個完全依賴可驗證性運作的百科全書來說,這無疑是百利而無一害的。


真實文字有骨架,AI文字一戳即空


維基編輯在清理過程中發(fā)現(xiàn),最能一眼識別「AI味」的地方,在于句子是否包含「事實」。


AI喜歡用形容詞和評價來支撐文章結(jié)構(gòu),而百科寫作則依賴年份、數(shù)量、地點、報道來源等可查證的事實。


為了讓更多編輯理解這種差異,《AI寫作識別特征》手冊特地列出了多類典型句式。


通過下面這組改寫案例,可以清晰感受到兩種語言的「骨骼」差異:


AI腔寫法:


The conference was a pivotal moment, highlighting the continued relevance of the field.


這類句子在指南中被稱為「重要性夸大+現(xiàn)在分詞結(jié)尾」。


「關(guān)鍵」「持續(xù)重要」等判斷沒有來源支撐,結(jié)尾的「highlighting…」屬于典型的AI空洞分詞結(jié)構(gòu)。


維基百科的規(guī)范寫法:


The 2023 conference in X City drew about 1,200 attendees. Coverage in Y Newspaper and the Z Journal discussed A and B policy proposals.


年份、參會人數(shù)、媒體報道——所有內(nèi)容都是可查證的事實。事件的重要性無需直接評價,事實材料會自行說明。


再看另一個例子,也是編輯們最常遇到的廣告腔:


The park offers breathtaking views and modern facilities, emphasizing its status as a renowned attraction.


指南將這種寫法稱為「模糊贊美/營銷語氣」:「breathtaking」「modern」「renowned」等詞匯在廣告中很合適,但在百科全書中毫無信息價值。


維基百科的規(guī)范寫法:


The park has two viewing platforms and a 5-km walkway. It recorded about 450,000 visits in 2019 and completed accessible restroom and visitor-center upgrades in 2021.


不使用主觀形容詞,不做定性判斷,只列出設(shè)施、年份、客流量等事實——所有內(nèi)容都有來源可查。


在維基百科的世界里,沒有來源的評價就是無效評價。


隨著AI生成內(nèi)容越來越多,我們讀到的語言難免會被模板化腔調(diào)包圍。


維基百科的做法提醒我們:判斷一段文字是否可靠,并不需要依賴神奇的檢測工具,而是要看這句話能否被驗證、這個判斷能否被追溯、這條信息是否站得住腳。


AI或許能寫出更流暢的句子,但百科全書在意的不是文字是否優(yōu)美,而是內(nèi)容是否可信。


當(dāng)空洞句子被刪除、廣告腔調(diào)被過濾、無出處的判斷被移除后,百科頁面上留下的就只有事實本身。


互聯(lián)網(wǎng)的未來,或許也會沿著這條路發(fā)展——越是AI生成內(nèi)容泛濫的時代,越需要人類為語言的真實性把關(guān)。


參考資料

https://techcrunch.com/2025/11/20/the-best-guide-to-spotting-ai-writing-comes-from-wikipedia/


https://www.theverge.com/report/756810/wikipedia-ai-slop-policies-community-speedy-deletion?utm_source


本文來自微信公眾號「新智元」,作者:傾傾,36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com