別鬧了,AIGC殺不死藝術(shù)家
“想要取代人類,你還差得遠(yuǎn)呢。”
AIGC生成內(nèi)容能取代插畫師、設(shè)計師的工作嗎?或者更瘋狂一點,AI 能批量生產(chǎn)藝術(shù)作品,乃至從根本上顛覆藝術(shù)市場嗎?
關(guān)于AIGC的爆紅我們已經(jīng)和科技界探討的足夠多,今天我們把目光轉(zhuǎn)向從業(yè)者——AI能否取代他們的工作?
下面是他們的回答。
畫家自己下筆之前都不知道會發(fā)生什么,AI如何能知道?又如何計算出來?
AI不能繪制的東西
當(dāng)我詢問能否清楚地辨認(rèn)AI和人類繪畫作品的時候,建筑系大四的吳佳佑給出了非常明快的肯定答案。吳佳佑正在申請英國倫敦皇家藝術(shù)學(xué)院的研究生,而他提交的申請作品之一即是一個由AI輔助創(chuàng)作的交互式網(wǎng)站,訪問的人可以在圖像搭建而成的互動頁面中探索由他設(shè)計的故事,而組成網(wǎng)站的所有圖像都由 Disco diffusion 和 MidJourney 這兩個2022年大火的AIGC人工智能生成工具制作。
“AI生成圖像在整體光影、結(jié)構(gòu)以及色彩上的表現(xiàn)在我看來無可挑剔,但很多細(xì)節(jié)經(jīng)不起推敲?!睂碛欣L畫功底,又經(jīng)常使用AI工具的吳佳佑來說(他的交互式網(wǎng)站制作花費了四個月的時間,期間用AI生成了數(shù)千張圖),目前AI生成圖片迥異于人類的風(fēng)格是顯而易見的。
“細(xì)節(jié)上經(jīng)常出現(xiàn)色塊堆積,過度不自然和線條粗細(xì)變化不均勻這樣的問題?!眳羌延幽弥医o的幾張在推特上頗受好評的AI生成圖像逐字句的點評起來,雖然只有大四,但他的口吻很自信。
對一個美術(shù)門外漢來說,這樣的細(xì)節(jié)(尤其你很多時候需要放大作品觀察)可能并不重要,但對專業(yè)人士來說,差別是顯著的。“我給同學(xué)說了竅門后,大家不管有沒有美術(shù)功底,基本上都能看出來。AI生成的圖像看不出繪制的前后順序,因為它背后沒有人類繪畫的基本邏輯支撐。”吳佳佑說。
問題的根源可能來自算法本身。目前的主流AIGC工具都采用了diffusion model 擴散模型,它的訓(xùn)練基于有文字描述的圖片數(shù)據(jù),通過對圖片反復(fù)降噪,AI學(xué)習(xí)如何生成符合文字描述的圖片。由于文字描述往往是整個圖片的內(nèi)容,因此AI深度學(xué)習(xí)的結(jié)果會對整體圖片結(jié)構(gòu)和光影的把握比較良好,而相對的在細(xì)節(jié)上就會失準(zhǔn),因為這些細(xì)節(jié)往往缺乏文字描述,又相當(dāng)復(fù)雜多變。
這可能是在日漫界最近熱炒的AI三大畫圖難題的來歷。所謂三大難題,指的是目前的AI模型不能完成的三種主題創(chuàng)作:薩菲羅斯游泳、樋口円香吃拉面和哭泣的美少女吃蛋糕。AI模型在輸入相關(guān)指令后往往會生成讓人啼笑皆非的圖片。
其實AI 不能完成的創(chuàng)作遠(yuǎn)不止這三種,比如如果你讓AI生成游泳的三文魚,那它大概率給你的圖片將會是三文魚片而不是活蹦亂跳的魚。
AIGC這些人類看來非常匪夷所思的錯誤同樣要歸因于算法,一旦給出的指令過于偏狹,比如日漫中較少表現(xiàn)的水中游泳動作,或者其畫面內(nèi)容存在較為復(fù)雜多變的物理交互邏輯,比如“吃拉面”圖像意味著同時處理人物、手指、面條和筷子這幾個在AI看來都屬于線條的內(nèi)容時,AI大概率會存在翻車的現(xiàn)象,因為訓(xùn)練算法所用的樣本集可能較少涵蓋相關(guān)內(nèi)容,而擴散模型對復(fù)雜細(xì)節(jié)線條交互變化的理解還相當(dāng)初級。
但細(xì)節(jié)往往是決定畫家藝術(shù)風(fēng)格和水平的決定性因素之一。插畫師元元是少見的迄今仍然堅持純手繪作圖的職業(yè)畫師,研究生畢業(yè)于清華美院的元元講述了科班美術(shù)生的結(jié)構(gòu)、線條色彩和細(xì)節(jié)是如何被訓(xùn)練的——因循著與AI生成完全不同的邏輯。
“老師會讓你以操場為主題畫十幅同樣的畫,一開始你會想要把每一條跑道線,按照透視、光影結(jié)構(gòu)完整的畫出來,但到某一個時刻,你會想要去若隱若現(xiàn)地處理某些跑道線,有些留白,有些加重,有些干脆去掉?!痹f,“很多時候畫家追尋的是這種主觀感受,作品生動不是說要畫的和真實世界一模一樣?!?/span>
繪畫的過程不僅考驗畫家個人的技巧(這部分AI很好達(dá)到),畫家作為個人,他的感受,心境乃至成長歷程、教育背景等都發(fā)揮了影響,這些數(shù)據(jù)量之龐大都是AI所無法計算的。更何況,對元元來說,真正的創(chuàng)作過程在于打破某些規(guī)則和邏輯,“國畫中很多時候松弛的閑閑一筆就是遠(yuǎn)山,層云。此處留白,彼處著墨,很多時候畫家自己下筆之前都不知道會發(fā)生什么,AI如何能知道?又如何計算出來?”
剝離所謂“低效率工作”意味著什么?
AI可以模仿的東西
就像對人工智能倫理的討論一樣,科技界對AIGC內(nèi)容對藝術(shù)性的沖擊的討論也經(jīng)常是模棱兩可的。技術(shù)至上主義者(硅谷的一大部分人)幾乎回避了有關(guān)藝術(shù)性的討論,對他們來說不斷而持續(xù)的精進(jìn)深度學(xué)習(xí)算法才是重要的事情。隨著數(shù)據(jù)集和算法的優(yōu)化,藝術(shù)性似乎同樣能被01的字符所表達(dá)。
某種意義上他們成功了,甚至連谷歌最新推出的基于擴散算法的 imagen video 模型在生成視頻方面都能夠模仿藝術(shù)家風(fēng)格(比如一只以梵高風(fēng)格繪就的貓咪在吃東西),而使用AI 輔助創(chuàng)作在許多游戲美術(shù)師的工作中已經(jīng)是通行慣例。在多家大廠有過游戲制作經(jīng)驗的阿丁在談到AIGC時頻繁提到一個詞——“喂圖”,意思是在游戲人物形象設(shè)計的最初——尤其針對一閃而過的NPC人物,美術(shù)設(shè)計會給AIGC工具輸入很多參考圖學(xué)習(xí),進(jìn)而快速生成符合游戲要求的結(jié)果。
“雖然還要經(jīng)過后期的調(diào)整,但AI現(xiàn)在確實已經(jīng)取代人力開始承擔(dān)這部分的工作量了?!卑⒍≌f,他們目前使用較多的工具是較為側(cè)重二次元風(fēng)格訓(xùn)練的novel AI ,它基于目前最火的 stable diffusion 模型,數(shù)據(jù)集由500多萬張帶有文本標(biāo)記的圖片組成。
然而通過“喂圖”訓(xùn)練的AIGC模型充滿了爭議。10月7日,推特用戶@BG_5you 基于剛過世的韓國著名漫畫家金政基作品使用 Stable Diffusion訓(xùn)練出了金政基風(fēng)格的繪畫模型,此舉引來的網(wǎng)友的如潮惡評,而緊接著10月底,工程師Ogbogu Kalu 因為把迪士尼簽約畫師Hollie Mengert的作品未經(jīng)同意后抓取訓(xùn)練出可以批量生成 Mengert畫風(fēng)的模型再度沖上熱搜。
如果說前者網(wǎng)友一邊倒的批評尚主要基于對死者的尊重,后者則將AIGC快速發(fā)展對現(xiàn)行插畫市場的沖擊鮮明地點了出來。要知道由于 Hollie Mengert簽約了迪士尼,甚至她本人都不能隨意發(fā)布自己的作品,而從畢業(yè)開始算起,她的畫風(fēng)形成至少花費了十多年的時間,相比之下Ogbogu Kalu訓(xùn)練新模型的時間只有幾個小時,且成本幾乎為零。
如果風(fēng)格模仿是如此的輕而易舉,那么畫家十?dāng)?shù)年的繪畫訓(xùn)練有什么意義?他們的商業(yè)價值又該被如何衡量?這樣的叩問出現(xiàn)在許多插畫師的心中。坦率地說,機器學(xué)習(xí)并不能準(zhǔn)確模仿所有風(fēng)格,但AIGC目前的進(jìn)化程度已經(jīng)強到開始對許多領(lǐng)域產(chǎn)生沖擊。阿丁就直言,既然AIGC已經(jīng)能夠介入游戲原畫和人物設(shè)計(“很多效果圖生成的精度比一般畫師高多了?!卑⒍⊙a充說),現(xiàn)在網(wǎng)上流行的美術(shù)外包中很多基礎(chǔ)工作很快就將被AI替代。
畫師們對此不是沒有警惕,許多人在給自己作品標(biāo)注“未經(jīng)許可不得使用”的版權(quán)聲明之外,還會加上“禁止AI學(xué)習(xí)”聲明,有些人則干脆從公開平臺撤掉自己的作品以防被抓取成為AI學(xué)習(xí)的數(shù)據(jù)。在二次元繪畫發(fā)育最成熟的日本,“AI 學(xué)習(xí)禁止”已經(jīng)成為了一個流行詞。
然而,對硅谷來說AI風(fēng)格遷移造成的爭議并不是他們考慮的首要問題,技術(shù)中立,更時髦的詞叫做 AI 的民主化 democratization of AI是他們的信仰,AIGC技術(shù)潛在的巨大商業(yè)前景才是真正重要的。根據(jù)彭博社的報道,投資了 stability AI 的 Lightspeed 合伙人Gaurav Gupta 直言不諱地表示,AIGC技術(shù)根本性地賦予了人們更多的權(quán)力,同時讓“低效率 inefficiency”工作從內(nèi)容創(chuàng)作中剝離。
“只要 AIGC生成內(nèi)容滿足質(zhì)量要求,我不介意全面使用它?!?/strong>
AI將替代誰?
Gaurav Gupta的表態(tài)幾乎是在明示AIGC生成技術(shù)對現(xiàn)有繪畫市場的顛覆性沖擊。如果我們把繪畫市場簡單分為商業(yè)繪畫和藝術(shù)繪畫兩部分的話,前者顯然會更直接受到影響。
對于這個問題,在某游戲工作室擔(dān)任原畫師的劉紀(jì)揚表現(xiàn)的很輕松,“許多人說它做出來的東西冰冷,我沒那么矯情,我就覺得它弄得挺好的,構(gòu)圖顏色都好。更深的內(nèi)容AI目前還做不了,但我覺得它給我們設(shè)計師和美術(shù)師的前期工作提供了許多思路參考。”劉紀(jì)揚說到。
在劉紀(jì)揚看來,盡管AIGC內(nèi)容在游戲策劃的最初階段能夠輔佐策劃更好的表達(dá)想要的游戲效果,但它尚不能介入游戲原畫師更高階和精確的工作?!拔覀兊脑O(shè)計,越到后期要求越精確、細(xì)致,AI 只能粗疏的在需求非常模糊的時候一次性生成許多選擇,但當(dāng)方向明確的時候,AI還無法勝任規(guī)?;挠螒蛟O(shè)計場景。”
相比之下阿丁的看法有所不同:“AIGC生成的高精度的圖片不僅可以應(yīng)用于前期策劃,在游戲的人物設(shè)計和場景設(shè)計中都將擁有廣泛的前景,與之相伴的就是大量腰部以下插畫師會失去工作,目前阻擋大規(guī)模使用的其實是潛在的法律風(fēng)險,而不是生成內(nèi)容的質(zhì)量本身。”
不只是游戲的前期策劃,泛化的商業(yè)繪畫領(lǐng)域,從影視美術(shù)、網(wǎng)站設(shè)計乃至圖書制作,現(xiàn)有的AIGC技術(shù)在描繪大場景、特定繪畫風(fēng)格和精細(xì)度效果上均有優(yōu)勢,更不必說其成本低、速度快,且不會被題材、風(fēng)格乃至數(shù)量局限的特點。盡管存在類似“游泳三文魚”這樣的問題,但毋庸諱言商業(yè)繪畫這個過去只能依靠人力的創(chuàng)意市場迎來了最強勁競爭者,首當(dāng)其沖受沖擊的將是對精度和創(chuàng)意要求不那么高的細(xì)分領(lǐng)域。
“說實話,只要 AIGC生成內(nèi)容滿足質(zhì)量要求,我是不介意全面使用它,因為真的會節(jié)省許多成本?!蹦骋痪€時尚雜志的執(zhí)行主編在被問及對AIGC內(nèi)容看法時說到。對時尚雜志來說,拍攝大片時產(chǎn)生的置景、燈光、場地成本是一筆不菲的開支,而大片的制作過程往往還受到時間、空間以及人員因素的限制。AIGC生成技術(shù)從根本上解決這些困難,同時還能極大拓展視覺語言的豐富程度——“要是AI足夠強大,我一個人就能制作一本雜志了不是嗎?”實際上,今年美國版《Cosmopolitan》已經(jīng)使用 MidJourney制作了一期封面。
中國人說“興之所至”,可AI根本無法“起興”,又能“至”去何處?
AI有創(chuàng)造性嗎?
如果說對商業(yè)繪畫領(lǐng)域AIGC的潛在顛覆性毋庸置疑,那么在藝術(shù)繪畫領(lǐng)域這個問題就充滿了爭議。
“如果你水平好的話是永遠(yuǎn)不可能被替代的?!边@是許多人強調(diào)的論點。盡管AI可以惟妙惟肖的模仿風(fēng)格,但它不理解圖像背后所代表的含義,換言之,AI不具備真正的創(chuàng)造力。
這不是說AIGC完全沒有任何創(chuàng)造力,Deepmind的創(chuàng)始人,當(dāng)代人工智能領(lǐng)軍人物Demis Hassabis 曾在Lex Fridman 的訪談中表示,AI的創(chuàng)造力可以讓它通過看數(shù)百萬張貓的照片來“創(chuàng)造”一只普通的貓,但人類目前還不能把高層次的抽象概念(比如發(fā)明象棋規(guī)則,而不是教AI學(xué)會下象棋)用算法準(zhǔn)確地表示。
從這個意義上說,探討 AIGC 的藝術(shù)性甚至顯得有些滑稽。被問及AI的藝術(shù)性時,藝術(shù)留學(xué)機構(gòu)創(chuàng)始人Evan 迅速就給出否定回答,他所在的藝術(shù)留學(xué)機構(gòu)每年向全世界頂尖藝術(shù)學(xué)府輸送大批學(xué)生,AIGC領(lǐng)域是他們關(guān)注的重點之一?!拔覀儗W(xué)生提交的申請作品主體是不建議過度使用有AIGC創(chuàng)作內(nèi)容的?!盓van說到。在他看來,藝術(shù)品的價值來自于背后的感染力,這種感染力只能來自人,相比之下,AI 作品太過“冷靜”、“匠氣”?!拔铱梢愿惺艿剿總€部分的精巧,但它的靈魂是不統(tǒng)一的,它不夠動人?!?/span>
藝術(shù)創(chuàng)作的立意和技法都服務(wù)于人本身的思緒脈絡(luò),“只要是稍微成熟點的藝術(shù)家,他的創(chuàng)作都是精準(zhǔn)的?!?對Evan 來說,真正突破和創(chuàng)造性的偉大藝術(shù)作品,永遠(yuǎn)不會拘泥于既有數(shù)據(jù)的窠臼,沒有人的主觀能動,AI作品精巧而平庸。
在自己專欄中大量使用生成圖片配圖的自由撰稿人小溫對此有個精妙比喻:有一類作品創(chuàng)作出來不用寫注釋,因為作品本身足夠牛;另一類則必須要寫注釋,否則大家不知道看的是什么;但最糟糕的作品就是有沒有注釋都無所謂,因為作品本身不夠好,而文字注釋也不夠重要。AI生成作品正屬于此類。
“AI依靠算法以結(jié)果生成結(jié)果,但人的創(chuàng)造過程最革命性的東西,嘗試和試錯,打破規(guī)則和重塑規(guī)則在這個過程中被根本忽略掉了,中國人說‘興之所至’,可AI根本無法‘起興’,又能‘至’去何處?”小溫補充道。
總的來說,AIGC在藝術(shù)領(lǐng)域的實踐目前來看更像是一件精準(zhǔn)執(zhí)行的工具,它可以產(chǎn)出精確的結(jié)果,前提是人本身已經(jīng)有了創(chuàng)意的框架。正如文章一開頭提到的吳佳佑,很難想象如果沒有AIGC工具的幫助,他的交互網(wǎng)站所需要的幾千張圖片該如何獲得。而在國外,資深的AI生成愛好者已經(jīng)開始運營AI制作電影——除了主創(chuàng)本人的配音,從語言腳本、鏡頭畫面到音效都將運用AIGC模型來完成。
AIGC的確實極大降低了人們的創(chuàng)作門檻,沒有經(jīng)過技法訓(xùn)練的人現(xiàn)在僅憑自己的想法就能方便創(chuàng)造屬于自己的作品,在未來這將重塑人們認(rèn)知藝術(shù)的維度,它的革命性就好像照相機之于油畫,在央美藝術(shù)史博士小楊看來,這同樣有一個漸進(jìn)的過程?!靶鹿ぞ叩某霈F(xiàn)總會帶來對藝術(shù)本質(zhì)理解的新思考,這在歷史上已經(jīng)發(fā)生了不止一次,相比于藝術(shù)技術(shù)的革新,藝術(shù)理論總是相對滯后的?!?/span>
話雖如此,小楊之前并沒有親自嘗試過AIGC工具,對于網(wǎng)絡(luò)上充斥著的 AIGC生成圖片內(nèi)容,她從專業(yè)角度以“不和諧”三個字概括。在推薦下小楊第一次使用MidJourney,選擇 Gothic letters (哥特式字母)和她名字拼音的縮寫作為關(guān)鍵詞,由于服務(wù)器不穩(wěn)定,MidJourney一口氣返回了三組共12張圖片,小楊看了之后說,這種水平還不如我從隨便哪個中世紀(jì)手抄本里剪切來的方便和好看呢。
這段話仿佛可以當(dāng)做對目前 AIGC與藝術(shù)關(guān)系的注腳。
隨著算法的發(fā)展,AIGC進(jìn)化速度只會加速而不會減慢,它不僅將對繪畫相關(guān)領(lǐng)域產(chǎn)生重大影響,在交互設(shè)計、實驗藝術(shù)乃至未來的元宇宙社交場景中,AIGC可預(yù)見的都將扮演重要角色。
在介紹完自己的交互式網(wǎng)站后吳佳佑告訴我,剛和英國皇家藝術(shù)學(xué)院的老師聊完他的作品,錄取的可能性很大,而他的專業(yè) information experience design 細(xì)分方向之一就叫 moving image design 動態(tài)圖像設(shè)計,這聽上去就像是專門為AIGC準(zhǔn)備的一條賽道。
而這究竟是AIGC技術(shù)的勝利,還是人的勝利呢?
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com



