百度人工智能這次玩大的!獨樂緣何不如眾樂?專欄
“世界將從移動優(yōu)先變成人工智能優(yōu)先。”當AlphaGo打敗世界圍棋冠軍一戰(zhàn)成名之后,有大佬如是感嘆。也正基于此背景,從硅谷到北京,人工智能大潮如今皆為熱浪滾滾。這個在上世紀50年代和80年代掀起過兩次高潮的技術,此時又逢“第三春”。
如果仔細觀摩這一輪的人工智能大潮特點,會發(fā)現其中細微的變化:過去一年來人工智能和深度學習最重要的發(fā)展不在技術,而是商業(yè)模式的轉變,包括谷歌、微軟、IBM等科技都將自己的深度學習IP開源,以及,中國人工智能公司的代表者百度。百度近日正式對外宣布開放其深度學習開源平臺PaddlePaddle,讓神秘的百度AI技術走出實驗室。
開源競賽引鳳來棲,工業(yè)與學術界皆利好
開源,意味著將程序的源代碼開放,任何人都可以隨意拿去使用、修改。表面上看,百度等公司此舉就像可口可樂會向社會公布其配方一樣不可思議。畢竟天下從來沒有免費的午餐。究竟,開源人工智能平臺的背后有何目的?對全球人工智能發(fā)展,又會產生什么影響?
首先無疑,這又是一場類似Android在手機操作系統領域一樣的生態(tài)布局。從如今Android和iOS兩大系統的差異化表現來看,開放平臺無疑將帶來更多的價值。百度此次開源同樣意義深遠。
深度學習平臺PaddlePaddle在開源之后,吸引了很多人工智能領域開發(fā)者的興趣,包括一些之前一直在Tensorflow和Caffe上練手的開發(fā)者。相比其它,在PaddlePaddle的幫助下,深度學習模型的設計如同編寫偽代碼一樣容易,設計師只需關注模型的高層結構,而無需擔心任何瑣碎的底層問題。尤其對于中小企業(yè),深度學習的研究幾乎沒有專利的技術壁壘,并可以節(jié)約他們在初期的人力成本,集群購買與維護成本,以及底層算法工具試錯成本。
PaddlePaddle的前身是三年前自主研發(fā)的深度學習平臺Paddle(Parallel Distributed Deep Learning,并行分布式深度學習),且一直為百度內部工程師研發(fā)使用。此前已經被部署到百度的30多項主要產品或服務中,包括預估外賣出餐時間、預判網盤損壞時間、精準推薦用戶所需信息、大體量圖像分類、字符識別(OCR),計算機病毒垃圾信息檢測、機器翻譯、甚至在自動駕駛等領域。對于研究人員而言,也可以就此平臺研究百度人工智能技術,也同時可以公開他們的研究成果,包括論文、博文、代碼和專利,與他人共享。簡而言之,在經歷了農業(yè)-工業(yè)-服務業(yè)后,未來經濟社會的一大趨勢在于,而是傾向于利用與分享知識去更好地做事,技能和專業(yè)知識的價值將會超過技術價值。
按照上述思路,如果說所謂的人工智能開源是一場人工智能界的“圈地運動”,那么“圈地運動”的本質上是“圈人與知識”。開源的代碼庫是百度最好的招聘廣告,它們不必再費力去尋找人才,人才自會對這些代碼感興趣。而在科技界,誰能贏得技術人才以及知識,誰就能占據話語權。
更多數據與反饋,提升人工智能“智力”
被馬克?扎克伯格稱為“心智理論”的深度學習技術作為人工智能的核心驅動,其動機在于建立、模擬人腦進行分析學習的神經網絡,它模仿人腦的機制來解釋數據,例如圖像,聲音和文本。但問題是,深度學習不是即插即用,它需要做很多測試、調整和適配工作。
百度此番開源自家深度學習平臺也將為了回收更多的反饋從而提升人工智能的智力。一切“閉門造車”并不利于人工智能、深度學習的發(fā)展,如果沒有更多人工智能專業(yè)人士進行這一工作,那么無論任何巨頭釋放出的深度學習算法用途將有限。隨著深度學習平臺逐個開放,讓過去那些有能力卻沒有機會使用的深度學習的技術人員去研究與探索,集眾人之力,優(yōu)化深度學習算法和模型,加快人工智能領域的發(fā)展。
對于人工智能,李彥宏曾在一次活動中提及了其與大數據之間的的關系,他認為,2006年之所以是人工智能的一個拐點,因為數據量越來越大,計算能力越來越強,過去不實用的,到2006年逐步進入了實用階段。
所以毋庸置疑,大數據是人工智能的重要基石。對于作為世界人口最多國家的第一大搜索引擎的百度而言,這并非難事。搜索引擎每天爬取大量的數據,百度是天然的大數據企業(yè),擁有完整、領先的大數據技術。但大數據倘若不繼續(xù)無限大,對于輔助人工智能技術的成熟還差那么一點點。所以,通過開源技術以挖掘更海量的數據“金礦”成為明智選擇。
一切人工智能系統在進行深度學習某個領域的時候,需要通過大量數據進行“訓練”。一個典型的例子是《浪潮之巔》吳軍所舉例的,在算法基本不變的情形下,如果單純透過把數據量加大1萬倍,那在機器翻譯中文的時候準確程度可以增加5%。今年百度世界大會上,李彥宏向外界首次展示百度人工智能的核心——百度大腦之時也用數據介紹了其成績,語音識別率達97%。在圖像能力方面的人臉識別準確率達到99.7%。百度大腦如今智商的超前發(fā)展更是基于深度學習算法、數據建模、大規(guī)模GPU并行化平臺等技術,實現了無時無刻不在學習與成長。幾年前,百度教會其系統識別花的圖像時,就采用了從視頻中截取的大約千萬張圖像。而后處理這些圖像,又動用了大量計算機組成的計算機網絡。
有意思的是,科技節(jié)從來也尊崇“禮尚往來”的道理。開源的結果也讓各企業(yè)之間的關系由競爭又變得“我中有你、你中有我”的“如膠似漆”。飽嘗開源甜頭的成功案例比如,蘋果Siri是基于開源的系統,此次做出AlphaGo的公司Deep Mind,也是基于Facebook開源的深度學習系統Torch。
百度釋放信號:欲領航中國AI參與國際競賽
人工智能一直被業(yè)內認為是繼電力和互聯網之后又一次對人類社會將產生顛覆式影響的技術,給全球科技巨頭帶來的震撼也正在迅速蔓延:谷歌、Facebook、微軟、蘋果、阿里巴巴、騰訊等國內外各個科技巨頭鉚足了勁往AI領域里探。但投入力度與表現實力相當的,全球只有三家:百度、谷歌和Facebook。關于人工智能領域,百度的棋局事實上早已越下越大。此前,無論是關于百度研究院的成立、“百度大腦”的培育,還是百度推出的Baidu Inside合作計劃、“Google Brain”之父吳恩達的傾力加盟等均代表了李彥宏布局人工智能的每一粒棋子。
此次PaddlePaddle平臺的推出又是百度人工智能戰(zhàn)略的又一枚重要棋子,百度成為國內首個開源深度學習平臺的科技公司。人工智能已進入劇烈競爭階段,行業(yè)搶位正式開始,不難看出巨頭們想“玩大的”以及跑馬圈地的野望。除卻期待提升整個人工智能行業(yè)水平的同時,這其中也暗含著百度欲領航中國AI參與國際競賽的愿景。
過去,企業(yè)通向成功的可靠途徑是優(yōu)化自身獨有的價值鏈。而如今,有遠見的企業(yè)在通過打造自身競爭優(yōu)勢的主要方式更多地是依靠“連接”的力量。這也讓筆者想到凱文·凱利在《必然》一書中提及一個重要的概念“重混”。凱文·凱利在書中援引經濟學家保羅·羅墨的觀點認為,經濟的真正可持續(xù)性增長并非來自新資源的發(fā)現和利用,而是源于將已有資源進行重新安排后,使其產生更大的價值。
百度深度學習開源平臺PaddlePaddle的開放也反映了整個科技進化的“重混”趨勢,當已構造起世界上最大的深度神經網絡的百度在這場開源競賽中不斷引鳳來棲之時,各取所需的同時勢必將帶來全新的增長可能性。
值得一提的是,在開放深度學習開源平臺PaddlePaddle之前,百度于9月中旬宣布成立獨立風險投資公司為人工智能等下一代科技創(chuàng)新項目提供支持,左手技術右手資本,雙管齊下的百度人工智能棋局正越做越大,以此寄希望實現中國AI在國際競賽的超車。未來暫未可知,但至少從目前仍看出百度以科技反哺人文社會的初心所在,“倘若知識和信息是一個海洋,百度其實是一艘船,而且是一艘大船,應該幫助很多人。從此岸到彼岸,從片面到全面,從一個點到很多點,從成功走向成功”。
——————————————————
王小琉(個人微信wangxiaoliu203406),微信公號“王小琉”。科技專欄作者,前中央媒體人。
智能硬件體驗者;IT&科技領域觀察者、記錄者、評論者。
1.砍柴網遵循行業(yè)規(guī)范,任何轉載的稿件都會明確標注作者和來源;2.砍柴網的原創(chuàng)文章,請轉載時務必注明文章作者和"來源:砍柴網",不尊重原創(chuàng)的行為砍柴網或將追究責任;3.作者投稿可能會經砍柴網編輯修改或補充。