當AI把繪畫藝術變成一門“語言藝術”

文/郝曉茹
“一名宇航員騎在一匹馬上,超現實主義風格”——將這句話的英文原文輸入最流行的AI繪畫程序,幾分鐘后,就能得到幾張宇航員在太空中騎馬的圖片。在我們普通人看來,AI生成的圖片質量已經達到相當高的水平。
對于技術研究人員來說,人工智能技術這幾年的發展是穩步向前的,一步一個腳印。但是對于普通人而言,體會AI技術的進展,主要是靠有沖擊力的時刻或事件,比如近十年來最具沖擊力的時刻必然是2016年人工智能圍棋程序AlphaGo戰勝人類頂尖棋手。而2022年最具沖擊力的時刻,莫過于人們“突然”發現AI繪畫生成的部分作品質量之高,似乎已經能夠以假亂真了。更重要的是,人們可以自己親自“操控”AI繪畫程序,生成各種自己想要的作品。
為了方便普通人理解,我們可以大致認為AI繪畫程序背后的工作原理是這樣的:互聯網上有無數張圖片,大部分圖片都帶著描述性的說明文字,通過學習人們是怎么給每一張圖片配說明文字的,AI繪畫程序學會了用文字來反向生成圖片。也就是從海量“給圖片配的文字”數據中,學會了“給文字配圖”。
這句輕描淡寫的“無數張圖片”實際上卻是個新一代AI繪畫程序成功的關鍵。專業人士從超大規模語言模型的發展上了解到,訓練數據量的量變會產生質變,經過海量數據訓練的模型,可以學到一些“通用的能力”。我們可以認為,AI繪畫程序是把有史以來互聯網上出現過的數億張帶文字描述的高質量圖片作為訓練數據(學習資料)進行學習。研究人員發現,AI繪畫程序學到的能力包括組合兩種不相關的概念,例如騎馬的宇航員、創造動物或物體的擬人化版本,例如人形的白蘿卜、把文字渲染成圖片,例如做廣告牌、轉換一張已有圖片的藝術風格、延伸一張畫的原有邊界或補畫、修改一張畫上的元素等等,更多能力仍在陸續解鎖中。
僅僅在一年前,最具代表性的AI繪畫程序還沒有引發如此高的關注度,或者說沒有“出圈”,只是在人工智能行業內受到了關注。那時候,AI繪畫程序生成作品中的代表作是一把“牛油果樣子的扶手椅”。雖然不足以沖擊普通人的感官,但它生成圖片的方式——“喂”給AI一句描述語即可,已經讓很多人躍躍欲試。到了2022年,對技術敏感的先鋒人士終于可以親自上手,輸入文字,用AI來作圖,把想象力轉化為繪畫作品,進而引發了AI畫畫的熱潮。
原則上講,現在只要會寫字甚至會說話的人都可以用AI來畫畫了。AI終于把繪畫藝術變成了一門“語言藝術”。但當人們帶著嘗試的心態,找到一個AI繪畫程序,通過輸入文字進行繪畫時,很快就會發現,把自己的想象力用語言描述出來,似乎并不容易,做不了幾張圖就詞窮了,而且做出來的圖往往都很普通,甚至還會有點兒嚇人,這是因為現階段的AI繪畫程序還有很多缺陷,所以也不免會有些失落。
再看那些令人叫絕的精美二次元漫畫女主角AI圖片背后,它們所使用的“描述語”,可能包含數百個字符。首先,完整描述了從眉毛到襪子再到人物所處背景的每一個細節。其次,添加了很多正向“咒語”,類似“最佳質量”“大師級作品”“超高清分辨率”“細節豐富的壁紙”“某某平臺的編輯之選”等等。最后,還使用了大量的反向“咒語”,要求AI繪畫程序不要生成什么樣的圖,比如不要手指錯亂的、不要低質量的、不要帶簽名的、不要帶水印的、不要中等質量的圖片、不要低質量的圖片、不要長脖子的……甚至還需要標記出不同描述語的權重值。而那些精美的寫實風格AI畫作背后使用的描述語,可能添加了另一種類型的“咒語”,比如光圈值、快門值,包含了光線、視角等方面的描述,甚至包含了高端相機品牌的名字?,F在,已經有專門的網站,反向從AI生成的畫中推導出它是用了哪些描述語(prompt)進行描述的。
也就是說,雖然從那些精彩的AI繪畫作品上,人們看到了AI繪畫程序的潛力,但要挖掘這種潛力,則需要好好掌握一門新的語言,一種專門用來跟AI繪畫程序打交道的方式。不僅要學會這門新的“外語”,而且要掌握各種不同的“方言”——不同的AI繪畫程序,對描述語的辨別又各有特色。
站在技術與藝術交匯處的、懂技術又懂繪畫的專業人士,只有真正掌握了這門新的“外語”,才能知道集合了全人類智慧的AI繪畫程序的上限會在哪里、不足是什么。這時候,再來討論AI繪畫對普通人、對創作者、對藝術和設計從業者的影響,才會比較合理。
- 除《中國經營報》署名文章外,其他文章為作者獨立觀點,不代表中國經營網立場。
- 未經本網授權,任何單位及個人不得轉載、摘編或以其他方式使用上述作品,違者將被追究法律責任。
- 凡本網注明“來源:中國經營網” 或 “來源:中國經營報-中國經營網”的所有作品,版權均屬于中國經營網(本網另有聲明的除外)。
- 如因作品內容、版權和其他問題需要同本網聯系的,請在30日內進行。
- 有關作品版權事宜請聯系:15210887578 郵箱:banquan@cbnet.com.cn