專攻人工智慧研究的台大資工系許永真教授,研究室名稱為 智慧型代理人實驗室(Intelligent Agents Lab),談到這個大眾頗為陌生的專有名詞,許永貞表示,其實是因為人工智慧曾經經歷過黑暗期,上個世紀 80 年代後期人工智慧被過度期待卻沒有辦法拿出相稱的成果,結果古典的人工智慧就被打入冷宮了。
不過從事人工智慧研究的學者過去 30 年還是持續在努力,目標並不是要以電腦來模擬或取代人類的智慧,因為那畢竟是太過遙不可及的事情,而是有沒有辦法將一些問題以最佳化的方式解決?後來也就把這些發展稱為智慧型代理人,許永真也提到,這個中文翻譯不夠傳神,因為 Agents 其實是有自主能力的。
什麼是智慧型代理人?
所以智慧型代理人,就是針對某些任務,在它知道的知識範圍內,能夠以最好的方式自主完成。古典人工智慧的目標是要跟人類一樣好,但是到了智慧型代理人,則是把目標放在把事情做好,所以不以人工智慧來形容,也是怕被誤解是古典人工智慧,現在主流的頂尖國際研討會其實是以 Multi-agent systems 為名。
許永真表示,智慧型代理人這個領域主要研究的方向是怎麼解決問題、怎麼做規劃、怎麼做不同實體之間的協調與互動,所以發展出很多演算法。現在最熱門的領域是機器學習,但機器學習只是人工智慧裡面的一小部分,其他還有自動規劃、互相協調等領域也都有各種演算法,而且這些領域應該會是下一波的研究重點。
你可以想像一下,透過機器學習打造了自動駕駛車,但是車與車之間、與號誌之間的互動與行程規劃,其實會是一大堆自動駕駛車上路之後會面臨的問題。
許永真是台大資訊系第二屆的學生,當時還沒有人工智慧的課程,直到大四有一位客座教授回台灣開了人工智慧的課程,才引發許永真的興趣,並且出國之後就專門研究人工智慧。為什麼覺得有趣呢?許永真提到,當時還是古典人工智慧,著重在自動推理的研究,也就是舉一反三的能力,這對許永真來說,如果電腦能做到這件事情,那實在太棒了!跟現在有點不同,現在的機器學習是要訓練電腦一萬次,電腦才有辦法成功自己做一次,但是那時候是反過來,想要達到教電腦一次電腦就可以自己做一萬次,所以當時被這種願景強烈吸引。
當然,現在回頭去看,當時的想像現在甚至也還沒有做到,但是如果當時沒有奠定那些基礎,也不會有現在的發展。許永真認為,從機器學習的發展來看,其實是需要很多基礎的到位,包括運算能力的增強、大數據的存在,不然就算空有演算法,機器學習仍然沒辦法發揮。所以現在機器學習發展的條件已經成熟了,但是想要人工智慧能夠自動推論、自動規劃,條件其實還不足。
所以人工智慧下棋可以下得很好,這當然是很重要的發展,可是棋盤本身是被定義得很清楚的,道路環境則比棋盤複雜多了,下棋的時候對手只有一個,一次只下一子,可是不管是智慧型工廠或是自動駕駛車上路,面臨的環境是動態而複雜的,甚至還有不守規矩的路人,這些問題不見得是現在機器學習的演算法就能解決的,甚至連問題都還沒有清楚定義,難題可能不是自駕車與自駕車之間的溝通,而是人與自駕車的溝通。
物聯網跟人工智慧有什麼關係?
最近許永真的研究主題是物聯網與人工智慧的發展,這兩者到底有什麼密切的關係?許永真表示,主要是 INTEL 看到台灣硬體製造的優勢與人才的豐富而與台大合作進行研究,並且成立了 Intel-臺大創新研究中心。而另一個更重要的原因是,物聯網將會是人工智慧發展的一個重要的準備。
我們現在有一些大數據已經讓機器學習有所突破了,但是隨著物聯網的普及,每一個裝置所帶有的感應器都會變成是產生與收集資料的前端設備,而這些資料將來就會讓人工智慧往下一個階段繼續進步。透過人工智慧產生決策之後,要怎麼去影響環境,同樣也要靠這些物聯網裝置當做是後端。所以人工智慧就像大腦,而物聯網的設備則有一些會是眼睛、一些是耳朵,還有另外一些會是手、腳。
台灣學界最大的問題是沒有開源文化
與 Intel 合作,加上留學的經驗,許永真發現台灣的產業界與學界中間是有落差的,美國的產業界則不斷的從學界取得最新的技術與人才,差異在哪裡呢?其實是開放程度,台灣的學界有不錯的研究成果,但是太過強調技轉授權的權利金,好像這樣國家或學校才不會被佔便宜或是圖利廠商,而美國的研究成果大多是開源的或是公開寫在論文發表了,產業界不只可以拿到程式碼,也能拿到研究資料。
開源的文化才是最關鍵的,因為大家都會拿到你的研究成果,所以你公開前就要做好一點,是人家馬上就能用的樣子,但台灣不是,因為不必開放,很多東西都只要可以發表論文就好,其實連半成品的水準都還不到,連帶很多人才從台灣學界出去,其實也沒有像是美國人才那樣已經從研究、開發到成品都經歷過,能獨當一面了。
此外,開源的好處還有很多,像是許多研究都共用相同的資料,這麼一來研究成果才能互相比較,像是 UC Irvine 或 ImageNet 就是很好的例子,反觀台灣許多研究成果不是鎖起來就是限定授權,研究者不是得花時間自己重新找資料,就是研究成果根本沒辦法互相比較和驗證,不只國內研究團隊沒辦法產生實質競爭或合作,國際研究團隊也不會看到台灣的成果。
許永真認為,台灣比較好的開源示範只有台大資工系林智仁教授的 LibSVM,剛好有一群 ACM 比賽的冠軍,真正做到能開放給全世界來使用。
如果要說台灣的問題,產業界大多是中小型規模,研發的認知與資源都不足,只能靠學界提供協助,而學界又沒有開源的習慣與規範,導致研究常常終止於發表論文,但距離產品化或商業化還有很長一段路,這中間有很大的距離需要更多的互動與理解,只有兩邊開始產生合作,對台灣的未來才會有所幫助。
在這方面,許永真認為林軒田博士將學界人才帶到產業界的 Appier,則是一個比較好的例子。
所以並不是做不到,只是希望可以有更多像是林智仁、林軒田老師這種將研究開源、產學合作的好事情發生,那台灣在各方面都會是很有希望的,而且這些事情每個人都能從自己做起。
註:關於開源文化的重要性,也可以參考「Google 簡立峰:AI 時代,如果你家有兩個小孩,一個出國賺錢,另一個把家裡照顧好」一文。
台灣學界培養人才,但產業界不會用,結果都被國際大廠挖走了
許永真也提醒,國際大廠是大舉挖角的,Google 的 DeepMind 裡面幾百個博士在研究深度學習,找人的方式是直接去學校把最優秀的博士畢業生直接高薪聘走,從學校到產業幾乎無縫接軌。而台灣的產業卻常常不知道怎麼用博士畢業生,這也不能怪產業界,學界自己也有要檢討的地方,所以雙方應該要有更多的互相溝通和互相理解。
許永真建議,最根本的是產業界要懂得問對問題,學界才有辦法幫忙解決正確的問題,而學界則要懂得怎麼讓研究的成果可以變成產業界能立即使用的解決方案,而不只是拿來發表論文,但是沒辦法落實在產業,最後產業界也要懂得怎麼產品化,而不是以為研發工作可以全部外包給學界。
現在其實人工智慧的產業很明顯已經成形,但台灣的人才栽培出來,結果都被挖走了,DeepMind 的黃士傑也是在台灣讀博士,畢業後就出國去工作。所以一方面學界想培養更多的人工智慧人才,但另一方面產業界卻可能還不知道自己為什麼要做人工智慧,不懂得如何問對問題並且用人工智慧的技術來解決,這也是為什麼許永真會想要站上 TEDxTaipei 發表演講,就是希望讓大眾知道:
其實人工智慧並不一定那麼高深,而是每個人都可以有機會運用的技術,只要問對問題,學界的研究者或是栽培出來的人才就能幫忙解決。
現在許永真的研究室栽培出來的學生可以被 Google、Facebook、Amazon 直接聘過去做人工智慧的開發,而一位去 Google 的學生回台灣跟許永真感嘆說,在台大做了好幾個月的專案,在 Google 一兩個禮拜就完成了,因為資料量夠大、硬體運算資源非常豐富,所以跑出來的結果甚至比原來還好。所以這也是人工智慧為什麼在中國或美國是有先天優勢的,一來是行動裝置這一波的發展台灣沒有跟上,再加上像是中國沒有隱私問題,所以資料量也就不足了,二來是市場也的確比較小。
註:關於硬體運算資源的重要性,也可以參考「黃士傑:AlphaGo Zero 只用了三天,就走過人類幾千年圍棋研究的歷程」一文。
許永真提到,之前做過一個研究,想要分析計程車的顧客會出現在哪裡,以減少空車率,結果跟車隊談好合作之後,卻只拿到五輛車的資料。這個計畫做完三年之後,北京做了一樣的研究,但是是用全北京所有的計程車資料。許永真表示,隱私權當然要重視,但是擁有資料的人也要意識到,這些資料能帶來的幫助是什麼?目前台灣的情況其實是技術擁有者與資料擁有者之間沒有溝通,於是很多事情無法有所進展,如果有溝通,就能在保護隱私的同時也讓社會更進步。
怎麼栽培出更多 AI 的人才?許永真:台灣限制太多了!
美國的主要大學最近幾年開了很多人工智慧的課程,培養出很多人才,讓更多人可以了解甚至從事人工智慧的研究與技術研發,那台灣的大學呢?許永真認為,還是有林軒田、李宏毅等老師很努力在線上課程或線下的演講不斷在努力,但是其實受限最大的是大學的教育制度,系所的招生與考試制度綁在一起,但美國大學進了學校才分系所,系所沒有名額限制,限制只存在於資源。
所以像是現在人工智慧很熱門,那史丹佛大學想收多少學生來研究人工智慧都可以,這就是為什麼史丹佛有 75% 的學生都修過電腦科學(Computer Science)這堂課。那學生太多、老師不夠怎麼辦?史丹佛就聘了很多的老師專門來教,或是開線上課程但是也會聘很多的助教,因為只看線上課程是沒有效果的。但是台灣的大學沒有辦法這麼有彈性的分配資源,不然很多老師有熱忱也願意多栽培人才。許永珍表示,自己可以透過線上課程教更多人了解人工智慧,但是並沒有配合的助教資源,很可惜。
人工智慧的時代,這樣栽培小孩才對!
在人工智慧的時代,下一代的教育會有什麼不同嗎?許永珍表示,其實人工智慧只是讓軟體或硬體變得更聰明了,這意味著下一代必須要了解科技,並懂得怎麼好好運用科技來幫助自己與社會解決問題,但是倒不見得一定得學怎麼寫程式,因為會寫程式與懂得善用科技是兩件不同的事情,如果沒有動機、沒有使用的環境,學寫程式就像學英文一樣,可能是沒有用的。
許永真認為,過去的教育希望小孩努力把該學的科目學好就好,但是這樣的觀念一定要打破。一個學生,其實越小的時候要接觸得越廣越好,慢慢才深化,所以這也是為什麼美國的大學入學的時候並不分科系,栽培所謂的 T 型人才才是比較正確的做法。
現在有很多人其實知識的廣度都不夠,所以也連帶會讓他們問不出對的問題。許永真說:「你可以不必變成五個領域的專家,但是你要知道如何與五個領域的專家對談與合作,所以你不能只懂自己的領域。」這種跨領域合作的能力是未來人才必備的能力,也是現在美國高等教育的重點。
台灣有不少大學生都只顧著把自己的事情做好,但是這樣將來也還是可能會變成一個沒用的人。許永真以自己為例,當初大學所修的那些學分,現在回頭去看,其實已經都沒有用了,但這不代表那些時間是浪費的,重點在於你有沒有獲得什麼能力?只顧著把自己的事情做好,就會欠缺了與別人合作的經驗和能力,這是必須要特別加強的。
思考一下,如果有一天你到 Google 去工作,你以為只要做好自己的事情就好嗎?你的同事可能來自許多不同的國家,他們還有可能是各個領域的博士,根本沒有共通點,那你知道要怎麼和這些人共事嗎?
所以讓自己變得更通才、更懂溝通與合作,是下個世代從小就要開始養成的習慣。另外,上大學之後,要開始有意識地培養自己做研究的能力。
美國的大學雖然大一都還是不分科系,但是有些學生已經開始進研究室了,而台灣的大學生則認為做研究是研究所才需要做的事情,其實不然,重點不在研究什麼,而是你能不能學會如何做研究,並且把這樣的能力帶到職場上?其實大學生已經很有能力做出很好的成果了。許永真鼓勵大學生,別虛度時光,尤其如果大學裡面有老師願意花時間帶學生做研究,那更要好好把握,大一就進研究室開始學習吧!
from INSIDE 硬塞的網路趨勢觀察 http://ift.tt/2zwoLxL
沒有留言:
張貼留言