皇璽會000013: INSIDE 硬塞的網路趨勢觀察電腦會自己畫圖！微軟 AI 把文字變成栩栩如生的影像畫面皇璽會 http://www.iwin688.com

2018年1月22日星期一

INSIDE 硬塞的網路趨勢觀察電腦會自己畫圖！微軟 AI 把文字變成栩栩如生的影像畫面皇璽會 http://www.iwin688.com

Photo credit: 微軟

近年 AI 在各領域表現大幅躍進，不管是作曲、建立另一個 AI，成果都相當讓人刮目相看前陣子京都大學發表了可以「讀心」的 AI，從無到有還原受試者正盯著的影像。現在微軟 AI 又在影像領域產生了新的突破，能夠看完文字敘述以後自己「畫圖」。

和 Google 的 Sketch RNN 真的要訓練電腦「畫」出具題而複雜的物件不同，微軟 AI 相較起來可能是個比較小的挑戰：他可以把文字敘述轉變成一幅畫。

微軟的 AI 產生器名為 Attentional Generative Adversarial Network (AttnGAN)。當然現在用文字來搜尋符合敘述的現成圖片已經不稀奇了，不過微軟除了教 AI 什麼樣的文字特徵與什麼樣的圖像配對以外，在論文中還提到，他們的 AI 史無前例地能夠從文字中過濾出不同的條件，用來產生畫面中不同的部位。

Photo credit: 微軟

舉例來說，如果輸入「這隻鳥有綠色的頭冠、黑色的基底和白色的肚子」電腦就會一個像素一個像素地重建出一幅相當精準的影像。

主要研究員何曉冬在新聞稿中解釋到，差別在於「如果你用 Bing 搜尋一隻鳥，你就得到一隻鳥的圖片，但是在這裡電腦則是無中生有，一像素一像素地創造出這個影像。」研究人員表示，這個 AI 產生器可以用來增強攝影師的影像編輯工作，或者當藝術家的繪圖助理。在新聞稿中還提到，也許未來甚至能直接從文字劇本生成動畫電影。

延伸閱讀：

from INSIDE 硬塞的網路趨勢觀察 http://ift.tt/2DBt3pt

更多資訊 http://www.iwin688.com