作者 呂 紹玉 | 發布日期 2016 年 01 月 28 日 18:57 | 分類 Microsoft , 軟體、系統 |
2016 年,絕對是可以期待人工智慧有大幅進展的一年,因為從 2015 年下半開始,各大科技公司紛紛開源自家的人工智慧成果,在 25 日,微軟也開源其深度學習語人工智慧領域的研究成果 Computational Network Toolkit(CNTK),將之放上 GitHub 供所有開發者使用,而且據微軟研究員說法,CNTK 在語音和圖像辨識能力方面,比 Google 的 Tensor 等四個開發者常用的 Toolkit 有更快的運算速度。
微軟的深度學習(deep learning)和人工智慧(artificial intelligence)藏在哪裡?其實很多地方都可以看到,最明顯就是語音助手 Cortana、Skype 翻譯的語音輸入。
微軟首席語音科學家 Xuedong Huang 表示,他和他的團隊一直焦慮於如何讓電腦能更快速瞭解人們在說些什麼,而他們也確實做出不錯的成績,跟據內部測試,CNTK 在運算跟語音和圖像辨識相關的深度學習模型時,比目前開發者常用的其他四個電腦運算 toolkit 都還要快。而這四個 toolkit 分別是Theano、TensorFlow、Torch 7、Caffe,其中 TensorFlow 是 Google 開發,並在去年 11 月開源的 Toolkit。
微軟說明,提升運算速度對深度學習這個領域是很重要的,因為有些很大的深度學習任務可能要花上好幾個星期才能完成,能加快速度就是很大一項進展了。
至於微軟 CNTK 加快深度學習運算的秘訣,則是靠 GPU,微軟發現,雖然 GPU 設計用於電腦圖像處理,但用在說話、聽、理解語音、辨識圖片與動作這類的演算法處理時,其效果也相當理想。且不管是只有一台電腦,或者是多台以 GPU 為主的運算伺服器,都可以跑得動 CNTK,因此對於那些預算有限的研發人員、致力於深度學習的新創公司,或者是擁有大量數據並要即時處理的大公司,都能盡情使用 CNTK。
Xuedong Huang 說,有了 CNTK,大家都可以加入微軟的行列,創造在人工智慧領域突破性的發展。
没有评论:
发表评论