CFan科學院:AI自畫像揭開智能創意冰山一角

CFan 電腦愛好者 2020-01-08 09:09應用 標簽:自畫像 創意 科學院

國外一項研究認為,在未來的幾十年間,美國47%的現有工作崗位將面臨被AI(人工智能)和自動化取代的風險。雖然不少專家質疑了這一算法,但是AI的威脅確實越來越近了。我們現在聊以自慰的就是,手動的或者重復性的工作可能會被AI搶走,但是創意性的工作則相對安全。事實真的如此嗎?其實AI早就對人類創意工作虎視耽耽,并且有了長足的進步。

AI自畫像技驚四座

紐約時報的編輯找到IBM研究院,希望他們能夠通過AI的方式畫一幅畫,以便作為一期AI專輯的封面。這個請求看起來簡單,其實暗藏了很大的挑戰。已有的AI技術,比如汽車智能駕駛、翻譯、玩游戲,甚至制作電影的預告片等等,這些任務不需要AI創建新材料,只需分析手頭已有的信息并根據訓練做出選擇即可。而現在要讓AI跳出已有資料,以“自我思考”的方式創造出全新的藝術作品,難度可想而知。最終,IBM的AI還是交出了令人驚訝的作業(圖1)。

201823jsjd01

圖1 AI自畫像——AI與人類創造力手牽手(圖源:IBM Research)

像人類一樣提煉作品主題

上述AI作品的產生,它的算法可以分為三大部分,有點類似于藝術家的創作過程,下面我們就來一一解說。

首先是確定作品的核心概念,也就是作品的主題。主題作為藝術作品的核心思想,在以往的AI創作中(比如寫詩),基本上都是由人事先指定好關鍵詞,AI是被動的。而此次的AI創作,研究員們決定由AI自行確定。

研究員們首先匯集了紐約時報上大約3000篇左右的AI相關文章,然后通過自然語言處理軟件分析這些文章,找出和AI高度關聯的語義概念,比如“機器人”、“自動駕駛”和“計算”等,共選擇了30項。

因為這些詞語本身并不包含“AI”字樣,所以軟件通過簡單的關鍵詞搜索是不可能將它們提取出來的,軟件只有像人一樣智能地“理解”了詞語的意義,才能精確完成篩選任務,其中自然語言處理技術起著重要作用(圖2)。

201823jsjd02

圖2 自然語言理解的實現模型之一(想要理解語言,電腦必須要理解這個世界)

文字概念需要圖形化,AI通過上述篩選出來的30項概念,訓練一個用于視覺識別的神經網絡(圖3),以便從紐約時報紛繁復雜的文章圖片中,挑選出含有AI意義的所有圖片,并按與AI的密切程度對圖片打分。在評分前十的圖像里,項目參與人員最終選定一張人和機器人握手的圖像(還是不能完全排除人類干預,需要與人類攜手合作)。

201823jsjd03

圖3 視覺識別神經網絡模型之一

從學習模仿開始的原創圖像

主題概念確定之后,AI接下來正式進入創作過程。人類畫家,開始學畫時大都經歷過一個學習模仿的過程,AI畫畫也是如此,只是它的方法更為獨特些。研究員們首先收集到1000多個機器人及人的手的圖片,作為AI的學習訓練數據集(圖4)。

201823jsjd04

圖4 機器人和人的手圖片示例

AI的學習模型大致分兩類,一類是判別模型(Discriminative Model),一類是生成模型(Generative Model)。假設給定一張圖,要求判斷圖里面是什么動物,貓還是狗,這就是判別模型。假設給定的是多個貓的圖集,然后生成一張不在此圖集中的新的貓圖,那么這就是生成模型。

本文所述的AI采用的則是深度學習模型生成式對抗網絡(GAN, Generative Adversarial Networks ),它同時包括了判別模型(D)和生成模型(G)。G不斷生成新的機器人和人的手的圖片,盡可能貼近原有數據集中的圖,以欺騙D;D不斷識別G所生成的圖片是不是真實的,將假的圖排除。這兩個學習模塊不斷博弈的過程,最終的結果就是產生一個足以亂真的牽手的圖片,并且是與原來數據集中的圖不同的新作品(圖5)。

201823jsjd05

圖5 生成式對抗網絡的工作原理模型

錦上添花的作品包裝

既然是為特定報刊定制的作品,當然要盡可能符合原有報刊的一貫風格。這對AI來說已經不是什么難事,將紐約時報以往的封面圖片匯集成數據集,訓練出風格轉換神經網絡,對上面新創作的人與機器牽手的圖片進行自動風格轉換,生成多幅作品,從中挑選出最滿意的就可以了,效果便是本文開篇的那樣圖了。

更多的拓展應用

IBM的AI自畫像技術,其獨到之處就是可以由AI自動確定主題概念,再以此概念生成全新的藝術作品,并且還可以根據要求定制不同的藝術風格。這可以應用到很多領域。比如作家可以通過它設計新書的封面,影視可以通過它設計海報,音樂家通過它設置專輯封面等等。

 

炸金花实用口诀