來源:極客公園
北京時間 8 月 20 日上午,特斯拉 AI 日如期召開,正如其名字預(yù)示的那樣,活動圍繞著 AI 人工智能展開。與以往不同的是,這次活動特斯拉沒有邀請媒體,也沒有邀請投資人,只邀請了相關(guān)領(lǐng)域的工程師們,因此拋開商業(yè)化的問題之后,這次活動更像是一場針對技術(shù)方面的前瞻性匯報與演示。
AI 日上,特斯拉人工智能和自動駕駛視覺總監(jiān) Andrej Karpathy 詳細(xì)介紹了特斯拉的「神經(jīng)網(wǎng)絡(luò)」,特斯拉眾位高管也著重闡述了特斯拉在自動標(biāo)記等技術(shù)上的進展,之前就備受關(guān)注的超級計算機 Dojo 也正式亮相了。
仔細(xì)觀察不難發(fā)現(xiàn),特斯拉 AI 日上介紹的所有技術(shù)似乎都隱隱傳達(dá)著一個信號:即便越來越多的車企采用激光雷達(dá)技術(shù)實現(xiàn)自動駕駛,馬斯克依舊要特立獨行,勢將「純視覺路線」進行到底。
擁有超強算力的「道場」Dojo
五天前,特斯拉官方曾發(fā)布一張海報預(yù)熱 AI 日活動。
海報上展示了一個大規(guī)模芯片模組的結(jié)構(gòu),包括芯片核心、銅板、散熱器、金屬外殼等組成元素,人們紛紛猜測這是否與特斯拉 AI 日上將公布的新產(chǎn)品有關(guān)。事實證明確實如此。
特斯拉AI日宣傳海報|特斯拉官網(wǎng)
這其實是一個集合了 25 塊 D1 芯片的訓(xùn)練模塊,而自研 AI 訓(xùn)練芯片 D1 可以說是 AI 日上最重磅的技術(shù)突破之一。
D1 芯片由特斯拉自主研發(fā),7 納米制造工藝,單片 FP32 達(dá)到算力 22.6TOPs,BF16 算力 362TOPs,這幾乎是目前市面上最強的芯片。
而且 D1 芯片可以進行無縫融合,25 個 D1 芯片構(gòu)成一個訓(xùn)練模塊,更多的訓(xùn)練模塊相互組合則構(gòu)成了擁有更強大算力的超級計算機 Dojo。
Dojo 的名字不是第一次出現(xiàn)了,早在今年 6 月的 CVPR 2021 工坊活動上,Andrej Karpathy 就介紹過這臺超級計算機,當(dāng)時的 Dojo 搭載的還是英偉達(dá)的芯片,總算力為 1.8 EFLOPS,被認(rèn)為可以躋身全球第五強超級計算機。
這次搭載了 D1 的 Dojo 亮相后,計算機博弈專家、芯片專家吳韌稱贊這是「很精彩的設(shè)計」,甚至在朋友圈表示「如果 Elon 原意,或許這是 nVidia 最大的競爭者,實際上芯片巨頭們的坐次可能需要重新排位。」
馬斯克一直認(rèn)為「解決自動駕駛的唯一方法是解決現(xiàn)實世界中的 AI 問題,無論是硬件還是軟件,除非一家公司具有很強的 AI 能力以及超強算力,否則很難解決自動駕駛難題。」
因此特斯拉這次推出擁有強大算力的超級計算機 Dojo,其實也是出于解決自動駕駛問題的考量。與其他超算不同的是,這個被命名為「道場」的超算,其所有力量只用來做一件事兒:訓(xùn)練 Autopilot 在內(nèi)的整個自動駕駛系統(tǒng)。
純視覺路線
「道場」已經(jīng)建好,受訓(xùn)的特斯拉 AI 神經(jīng)網(wǎng)絡(luò)更是關(guān)鍵。
特斯拉的神經(jīng)網(wǎng)絡(luò)主要用來處理物體識別和道路規(guī)劃等功能所需的數(shù)據(jù),這些是支持特斯拉 Autopilot/FSD 得到基礎(chǔ)。
AI 日上,特斯拉 Autopilot 工程主管 Milan Kovac 向觀眾展示了特斯拉的 AI 神經(jīng)網(wǎng)絡(luò)究竟是怎樣應(yīng)用的。
特斯拉汽車的視覺組件|特斯拉官網(wǎng)
在特斯拉的汽車中,每輛車裝有 8 個攝像頭,每個攝像頭獲取原始輸入后能創(chuàng)建不同的分辨率,用于不同的功能和目的,最終這些信息會被輸入到復(fù)雜的神經(jīng)網(wǎng)絡(luò)中,生成對自動駕駛有用的附加信息。
然而問題在于,即便擁有 8 個攝像頭,其背后神經(jīng)網(wǎng)絡(luò)的矢量空間依舊不夠。于是,特斯拉研發(fā)了自動標(biāo)注技術(shù),即便行駛過程中視野被遮擋,根據(jù)數(shù)據(jù)的標(biāo)注,車輛也能更安全、準(zhǔn)確的導(dǎo)航。
Andrej Karpathy 還稱,現(xiàn)在特斯拉的自動駕駛場景模擬系統(tǒng)可以在行駛過程中實時繪制路況,結(jié)合多個車輛經(jīng)過同一地點的繪制,得到一個完整的地圖。
而這恰恰是特斯拉和 Waymo 等競爭對手最大的不同:基于類似人腦的視覺感知系統(tǒng)、自動化標(biāo)注能力,以及仿真等功能,特斯拉在 Autopilot/FSD 上試圖擺脫激光雷達(dá),力圖將「純視覺」路線走得更加徹底。
這確實是馬斯克一貫的堅持。
2019 年,馬斯克一句「把激光雷達(dá)裝在車上真的很蠢」,直接將自動駕駛技術(shù)路線一分為二,激起千層浪。
以特斯拉為代表的僅以攝像頭與各種傳感器作為硬件,背后重算法的路線,與 Waymo 為代表的注重激光雷達(dá)的技術(shù)路線,站在了對立面。
關(guān)于二者誰能走到最后,到今天也沒有出現(xiàn)一個決定性的結(jié)論。
激光雷達(dá),顧名思義是以激光作為信號源,由激光器發(fā)射出的脈沖激光打到周圍物體上引起散射,一部分光波會反射到激光雷達(dá)的接收器上,根據(jù)激光測距原理計算,就得到從激光雷達(dá)到目標(biāo)點的距離。激光不斷掃描目標(biāo)物,就可以得到全部數(shù)據(jù),成像處理后,可得到精確的三維立體圖像。
而在馬斯克看來,「純視覺感知才是通往真實世界 AI 的道路」,既然人類是通過視覺收集信息輔以大腦處理信息的方式進行駕駛,那自動駕駛也應(yīng)當(dāng)能通過視覺感知輔以算法處理的方式實現(xiàn)安全駕駛。
當(dāng)外部環(huán)境越來越復(fù)雜,自動汽車上安裝的傳感器也越來越多,如果雷達(dá)與攝像頭傳來的信息互相矛盾,自動駕駛系統(tǒng)反而會更加難以抉擇。
馬斯克拒絕「拉扯」,他選擇直接將攝像頭的作用發(fā)揮到極致。
將「第一性原理」貫徹到底?
熟悉馬斯克的人都知道他一直奉行「第一性原理」,即回歸事物最基本的條件,將其拆分成各要素進行結(jié)構(gòu)分析,從而找到實現(xiàn)目標(biāo)的最優(yōu)路徑的方法。
目前「感知、判斷駕駛環(huán)境」無疑是自動駕駛領(lǐng)域的核心困難,馬斯克依舊回歸到「感知」的基礎(chǔ),不遺余力地將 AI 進化到能與人類視覺感知媲美的地步。
馬斯克認(rèn)為,毫米波雷達(dá)不擅長描述物體的缺陷是幾乎不可能彌補的,而攝像頭不擅長探測距離的缺陷卻是可以彌補的。為了「一步到位」,馬斯克絲毫不考慮將激光雷達(dá)安裝在特斯拉上。
事實上,特斯拉的「純視覺路線」,需要更加深度地學(xué)習(xí)海量的數(shù)據(jù),深度訓(xùn)練神經(jīng)網(wǎng)絡(luò),這一點對于其他的自動汽車公司而言,絕不是敢輕易嘗試的。馬斯克能堅持下去,和其起步早、能積攢的數(shù)據(jù)多不無關(guān)系。
據(jù)高盛估計,目前特斯拉車隊的數(shù)量在全球超過 150 萬輛,這為特斯拉提供了大量、多樣化和真實世界的數(shù)據(jù)庫。這意味著,即便數(shù)據(jù)采集效率相同,跑在路上的特斯拉數(shù)量是對手的數(shù)十倍,數(shù)據(jù)量也就是競爭對手的數(shù)十倍。
再加上今年特斯拉一季度銷量在全球范圍內(nèi)飆升到了 18 萬輛以上,有著超過 200% 的漲幅,整體而言特斯拉的盈利處于上升狀態(tài),研發(fā)資金方面也無需憂愁。充足的資金,讓特斯拉敢于為純視覺自動駕駛路線「砸錢開路」。
特斯拉想在技術(shù)路線上保持自己的獨特優(yōu)勢是可以理解的,據(jù)相關(guān)人士分析,如果特斯拉能在「純視覺」上開辟出一條道路來,形成獨特的自動駕駛技術(shù)閉環(huán),無疑會讓特斯拉距離「電動車界的蘋果」更近一步。
當(dāng)然,這個決策背后的商業(yè)風(fēng)險也是不容忽視的。
因為另一邊,隨著隨著技術(shù)發(fā)展,激光雷達(dá)不斷完善優(yōu)化,價格也在逐漸下降。
激光雷達(dá)頭部公司 Velodyne 本周宣布,其最受歡迎的激光雷達(dá)系統(tǒng) VLP-16 的價格相比 2016 年降低了一半。激光雷達(dá)價格下降受惠于產(chǎn)能、研發(fā)成本平攤;輔助自動駕駛推廣等因素。
如今,已經(jīng)有越來越多的車企選擇了激光雷達(dá),這意味著未來「激光雷達(dá)」的技術(shù)路線或許將比「純視覺」路線擁有更多的規(guī)模效應(yīng)以及成本優(yōu)勢。
而如果未來視覺+激光雷達(dá)一派,在自動駕駛能力上做到和特斯拉相差不多,則意味作為「破風(fēng)者」的特斯拉,為純視覺路線自動駕駛探索砸下的成本會和收益不成正比。這對于需要長期投入的特斯拉來說,將是不小的壓力。
但對于馬斯克而言,他不在乎。他似乎就是要在第一性原理的的思想下,以愚公移山的勁頭,在自動駕駛領(lǐng)域跟「純視覺路線」一路死磕到底。
(實習(xí)生謝睿哲對稿件亦有貢獻。)