2018年2月5日 星期一

INSIDE 硬塞的網路趨勢觀察 Google 機器學習跨足天文、生物 對我們的啟示?簡立峰:跨領域整合 強化開源工具 皇璽會 http://www.iwin688.com

Google 又跨刀!沒有天文背景如何助力 NASA 

讀者是否還記得去年度 INSIDE 曾報導過 Google AI 助力 NASA,發現了「迷你太陽系」, 先前 太陽系 8 顆行星圍繞太陽運行。但就在去年底,天文學家宣佈在 2545 光年外有一個名為「克卜勒 90」(Kepler-90)的恆星,它周圍有著同樣數量的行星運轉,如同另一個小型的太陽系。

由 Google Brain 和 NASA 突破性的天文研究,先前已刊登於《天文學雜誌》,Google Brain 研究團隊資深軟體工程師 Chris Shallue 今日透過視訊頗析機器學習在在今日與我們分享研究過程。

人類從未停止過對宇宙的思考和探索,在 2009 年 NASA 克卜勒任務原先藉由克卜勒望遠鏡記錄系外行星,從恆星前方經過導致的恆星亮度輕微下降現象,這種亮度下降信號可以讓科學家們間接推算出行星的存在以及這顆行星的物理性質。

4 年間運作時間裡收集了三萬個可能的行星訊號。天文學家們運用自動化分析技術配合人工核對判讀光圖,但是問題來了,天文學家對其他數萬個特徵不明顯的訊號圖肉眼幾乎無法辨識,但在那其中,仍存在著未被所出的星體,於是人工智慧派上用場,促成 NASA 與 Google Brain 合作。

在數萬訊號理許多較弱的訊號同時也有較多雜訊,無法透過人工方式判別是否為
行星

套用先前在圖像辨識上相當成功的卷積神經網路 (convolutional neural network),利用 15000 個天文學家已人工標記的克卜勒訊號來訓練模型,透過模型搜尋克卜勒資料庫中的 670 個恆星,以此辨別新行星,最終在數量龐大的星體中發現 克卜勒-90 i 和克卜勒-80 g。

也許你認為,機器學習要執行不同專業仍有難度,從找到的比例來看 670 個恆星只找到了兩顆新行星,比例遠低於人類辨識出的,但回歸到訊號複雜的光圖來看,人類所能辨識的為曲線明顯的,機器負責解決的是海量訊號微弱的數據,對天文學和工程師來說雙方的合作的確帶來突破性的發展,大幅降低人力耗損,甚至做到人類無法辨識的光圖,他們的下一步是要運用模型運算整個克卜勒資料庫中超過 20 萬顆的恆星。

Google 機器學習多元跨領域 對台灣的啟示

Google 在去年度機器學習系列媒體聚依序分享了醫療、翻譯及 YouTube 影音如何透過人工智慧創新應用,今年第一場機器學習系列,他們揭示機器學習運用在天文領域的概念,Google Brain 跨領域的各項專案陸續為各產業帶來創新應用,不過回歸 Google Brain 的本質,他們是資工的背景,開發出新專案提升機器學習能力的目的為何呢?

簡立峰在今日媒體聚特別提到值得台灣重視的兩大要點,工程跨領域的貢獻以及開發源碼的重要性,事實上,研究團隊從事不同專案目的不在對該領域的鑽研,是希望能與這些產業也更深入的合作,過去普遍認為機器學習是資工人的課題,但如何突破神經網路就必須和其他領域接軌,一方面能帶挹注該領域的產能,一方面也能藉由深入合作更加瞭解如何做出最有效的工具來幫助該領域人員。

台灣機會在哪?

今日除了天文學以外,Google 也邀請到另一項 「基因測序」專案分享案例 ,新一代測序儀提供低成本、高通量的工具,但由於這些 DNA 讀序相當片段, 加上測序儀的結果有許多錯誤,因此 Google Brain 與生技團隊合作開發提高基因組測序準確性的開源工具。

簡立峰提到目前台灣在農產業有很好的根基,加上台灣新創在基因檢測投入相當多,若能繼續結合機器學習,將對是農業、病蟲害問題都有很大的助力,可以透過開放工具讓檢測準確率更高 。

談到 AI 馬上讓你想到複雜電腦運算或深奧的學習模型架構,不過隨著技術開發,越來越多資源普世大眾,包含近日 Google 旗下雲端服務 Google Cloud 內加入 AutoML 的應用項目,讓沒有資訊背景的人能以更簡單方式建立學習模型,套用在旗下服務內容,未來我們的人才將如何善用這些資源將是產業突破的重大轉捩點。

延伸閱讀:



from INSIDE 硬塞的網路趨勢觀察 http://ift.tt/2BeY6pk










沒有留言:

張貼留言