近年 AI 在各領域表現大幅躍進,不管是 作曲 、 建立另一個 AI,成果都相當讓人刮目相看前陣子京都大學發表了可以「讀心」的 AI, 從無到有還原受試者正盯著的影像。現在微軟 AI 又在影像領域產生了新的突破,能夠看完文字敘述以後自己「畫圖」。
和 Google 的 Sketch RNN 真的要訓練電腦「畫」出具題而複雜的物件不同,微軟 AI 相較起來可能是個比較小的挑戰:他可以把文字敘述轉變成一幅畫。
微軟的 AI 產生器名為 Attentional Generative Adversarial Network (AttnGAN)。當然現在用文字來搜尋符合敘述的現成圖片已經不稀奇了,不過微軟除了教 AI 什麼樣的文字特徵與什麼樣的圖像配對以外,在 論文 中還提到,他們的 AI 史無前例地能夠從文字中過濾出不同的條件,用來產生畫面中不同的部位。
Photo credit: 微軟舉例來說,如果輸入「這隻鳥有綠色的頭冠、黑色的基底和白色的肚子」電腦就會一個像素一個像素地重建出一幅相當精準的影像。
主要研究員何曉冬在 新聞稿 中解釋到,差別在於「如果你用 Bing 搜尋一隻鳥,你就得到一隻鳥的圖片,但是在這裡電腦則是無中生有,一像素一像素地創造出這個影像。」研究人員表示,這個 AI 產生器可以用來增強攝影師的影像編輯工作,或者當藝術家的繪圖助理。在新聞稿中還提到,也許未來甚至能直接從文字劇本生成動畫電影。
延伸閱讀:
from INSIDE 硬塞的網路趨勢觀察 http://ift.tt/2DBt3pt
運動彩券 | 最高返水0.98精彩運動MLB、NBA比賽、直播
六合彩球 | 香港六合彩、大樂透、威力彩、今彩539
真人娛樂場 | 百家樂、德州撲克、麻將遊戲、21點、13支
電子遊戲 | 水果盤、捕魚達人千炮版、骰寶、輪盤
黃金期權 | 全新開放 、 股市 、 黃金 、 外幣
百鬼夜行 | 30線、4500倍、拉霸、五鬼運財
沒有留言:
張貼留言