一幅由人工智能(AI)生成的“中國情侶”圖片近期在國內外社交媒體上被廣泛轉發,其逼真的視覺效果令不少網友感嘆:“AI已經不遜于人類畫師了。”這幅作品由AI圖片生成工具Midjourney最新推出的V5版本生成,該工具是近期繼GPT-4后又一受到關注的AI產品。在接受《環球時報》記者采訪時,多名人工智能與互聯網業內人士認為,Midjourney V5版本代表了目前生成式AI的前沿水平,其生成的圖像在某些領域已經得到商用,通過繼續學習和技術迭代,預計其能力可以進一步增強。不過,上述人士也提到,Midjourney以及生成式AI由于通過公開數據進行訓練,其生成的作品在版權等問題上存在較大爭議。
“中國情侶圖片”是如何出圈的
由美國一家工作室開發的Midjourney于去年3月首次亮相,在當年8 月迭代至V3版本并開始引發一定的關注,而今年更新的V5版本讓Midjourney及其作品成功“出圈”,代表作是上述的“中國情侶”圖片。
在這張圖片中,一對年輕中國情侶穿著夾克和牛仔褲坐在樓頂,背景是上世紀90年代的中國城市。由于在光影、人物細節、氛圍感等方面的出色刻畫,這張圖片甚至被一些網友認為是一張真實拍攝的老照片,而非AI生成的圖片。
據外媒報道,自上線以來,Midjourney在圖像細節上一直在不停進步。Midjourney官方表示,V5版本的圖像質量更高、輸出更多樣化、有更廣泛的風格、支持無縫紋理、有更寬的縱橫比、有更好的圖像提示以及更寬的動態范圍等。
此外,該版本還大幅優化了此前無法準確生成人物手部的問題。一名使用過Midjourney的畫師告訴《環球時報》記者,在此前版本中,Midjourney對手部刻畫有很多問題,例如手指數量錯誤或形態扭曲,這也是此前分辨圖片是否為AI生成的主要判斷依據。不過,Midjourney V5版本在這方面有了明顯提升,雖然仍能觀察到手部不自然的情況。
在V5版本之前,Midjourney已得到一系列應用。去年9月,一幅名為《太空歌劇院》的作品獲得了美國科羅拉多州博覽會藝術比賽的金獎,這幅作品就是由Midjourney完成的。去年6月,英國雜志《經濟學人》曾使用Midjourney設計過一期封面,以呼應“AI新前沿”的封面故事主題。
《環球時報》記者近日也體驗了Midjourney,該技術目前主要在通訊軟件Discord上以與“Midjourney bot”對話的形式使用。通過輸入提示詞的方式,記者可以讓Midjourney bot生成相應的圖片,提示詞可以設定很多,還可以要求分辨率、是否寫實風格等。通常Midjourney bot會在1分鐘左右生成4張圖片,用戶還可以要求重新生成。
在使用過程中,記者發現Midjourney的另一個問題:用戶只能通過提示詞來提出要求,但無法對圖片生成過程進行控制或修改,圖片生成更像是一個“黑盒”。因此,用戶需要不斷更換或調整提示詞,讓生成的圖片更符合需求。創作出《太空歌劇院》的杰森·艾倫就曾對外媒透露,他總共生成了900多張圖片才挑選出滿意的作品。
背后是什么技術
業內人士告訴《環球時報》記者,Midjourney是一種大模型生成式AI。2015年,谷歌公司的一名研究員創建了首個用于藝術創作的機器學習應用 DeepDream。此后,AI圖像生成開始走進大眾視野中。
一家知名跨國企業的AI算法工程師李濤告訴《環球時報》記者,基于擴散模型,Midjourney打造了自己的閉源模型,通過抓取大量公開數據進行訓練。與此同時,Midjourney也不斷收集用戶反饋數據并對模型進行迭代,最終形成目前的成果。
擴散模型屬于一種無監督生成模型。計算機視覺處理開源軟件庫OpenCV負責人馬利克在接受外媒采訪時曾表示,擴散模型利用從文本數據中獲得的知識來理解單詞集合在一起的語義,并與真實世界聯系起來,這使AI能夠在不依賴特定數據集的情況下生成更復雜和多變的圖像。馬利克認為,擴散模型是生成式AI的重大進步,因為它們不依賴監督學習。通過利用從無監督學習中獲得的知識,這些模型可以生成復雜多樣的圖像,而無須手動標記數據,從而使其更加靈活。
一段時間以來,不少公司均推出了AI圖片生成模型或相關產品。近日,微軟Bing宣布接入OpenAI的AI繪畫模型DALL·E,上線了AI生成功能,Adobe也為旗下的Firefly模型新增了AI繪圖產品。
“再無法相信自己的眼睛”
盡管憑借強大的圖片生成功能,Midjourney已經獲得上千萬用戶,但它也受到大量的批評與質疑,首當其沖的就是版權問題。
美國《福布斯》雜志網站稱,與所有AI圖片生成工具一樣,Midjourney從互聯網上搜集了大量圖像進行訓練,使其能夠創作出看似全新的藝術作品,這引發了人類創造者的不滿。目前,已經有不少機構和個人對Midjourney發起起訴,指控該公司涉嫌廣泛地侵犯版權。
另據媒體報道,美國版權局近日宣布,Midjourney等生成的AI圖像不受版權保護。在說明文件中,美國版權局認為,通過Midjourney等平臺自動生成的作品,在整個創作過程中完全由機器人自動完成,并且訓練的數據是基于人類創作的作品,因此不受版權法保護。
上海申倫律師事務所律師夏海龍對《環球時報》記者表示,AI生成工具給人類的版權法帶來巨大沖擊。一方面,相較海量的AI生成作品,即使其中存在侵權情況,權利人也很難及時發現;另一方面,在AIGC(人工智能生成內容)時代,冗長、昂貴的司法程序導致對版權保護也會越來越力不從心。人類的版權法以及著作權保護機構恐怕不得不作出重大調整。
除版權問題外,越來越逼真的AI生成內容也讓人擔心這些圖片、視頻可能會被用作非法用途,例如用AI生成的圖片進行欺詐。美國前總統特朗普日前宣布,他將于21日被逮捕。隨后,大量通過AI生成的“特朗普被捕”圖片在社交媒體上傳播,誤導了一部分網友。印度News18新聞網則提到,近期有網友通過AI生成了一張美國前總統奧巴馬與德國前總理默克爾在海邊一起吃冰激凌的圖片,這讓人們更加擔心未來會出現怎樣的深度造假。該網站援引網友的評論稱,“這種技術正變得越來越可怕。技術越來越完善,目前的AI可以創建幾乎完美的名人聲音或圖片,我們可能很快再無法相信自己的耳朵和眼睛。”此外,也有家長向《環球時報》記者表達了AI生成不當圖片對兒童影響的擔憂。
互聯網專家郭濤對《環球時報》記者表示,當前AIGC技術尚處于早期探索階段,相關法律法規、標準體系和倫理規范等還不健全,存在數據安全風險、著作權侵權風險、深度偽造風險、商業秘密泄露風險、違法信息傳播風險等問題。有關部門需要盡快建立健全相關法律法規和標準體系,加強內容審查及內容過濾,推動行業健康可持續發展。
本網站及其公眾號為公益性網絡平臺,所發圖文僅供傳播信息、介紹知識、說明問題之用;相關版權歸原作者所有,轉載請務必注明出處和作者。
稿件一經選用,即視為作者同意本網免費將其使用于本網或與本網有合作關系的非贏利性各類出版物、互聯網與手機端媒體及專業學術文庫等。
由稿件引起的著作權問題及其法律責任由作者自行承擔。
了解更多動態,請掃描二維碼,關注我們的微信公眾號: