揭秘Google地圖背后的秘密:隱藏的算法與人工操作評測
導航在近幾十年經歷了翻天覆地的變化。上世紀90年代,我們要在箱內塞滿紙制地圖,后來可以從Mapquest地圖查詢網站打印地圖,而現在可以無腦地聽從Siri或Google地圖的指示。但這些指令背后,包含了你想不到的大量數據。
尋找“地面真相”
在加州,Google地圖團隊通過算法與細致手工作業相結合的方式,改善地圖,這項工作被稱為“地面真相(Ground Truth)”。該項目于2008年啟動,但到幾年前都處于保密狀態,并一直持續發展,現已覆蓋了51個國家。而算法在從衛星、航拍以及街景圖像中提取信息上,扮演了更為重要的角色。
街景項目在2007年啟動,當時它能提升用戶體驗,通過讓人們看到其目的地的周圍區域幫助定位。Google地圖的副總裁Brian McClendon說:“我們很快就意識到,制圖的最佳方式之一就是擁有世界街道的攝影記錄,然后再求助那些隨時能對其糾錯的人。”
隨著街景項目發展,團隊意識到只抽查數據是不對的。街景勘測車現已行駛了超過700萬英里,包括了美國99%的公共道路。Google地圖的產品經理Manik Gupta說:“這實際上允許我們用算法,從提取信息中構建新數據層。”這些算法從計算機視覺和機器學習等領域借鑒方法,進而從街道編號、商戶名稱、交通標志、限速標識以及其他興趣點上提取特征。
McClendon說:“停車標志無關緊要,它們只是做得顯眼而已。通路標志提取起來更困難,因為它們并不一致,但我們現在對此變得聰明多了。”轉彎限制標志對導航可謂重中之重,但通過算法捕捉則顯得很棘手。有時指示箭頭噴涂在路面上,有時它們則在頭頂上,顏色和尺寸各有不同。
路標也很重要。如果司機從導航儀聽到的內容能與看到的路口相匹配,那么他們就能更容易地跟隨語音指示,但有時用在路標上的拼寫和縮寫卻各有不同。McClendon說:“匹配標識上所寫的東西實際上是一項困難且重要的問題。”
其他算法從衛星和航拍圖像中提取建筑物的占地面積和高度,多數美國建筑物現已出現在Google地圖上,對于地標,計算機視覺技術會對其提取細致的3D模型。Google曾表示,它們收購高分辨率衛星圖像公司Skybox,至少在最初是為了提高地圖的準確性。
地圖背后的人工團隊
衛星和算法只能讓你得到迄今為止的數據,Google雇傭了一個人類操作員小隊使用一種叫做“Atlas”的內部程序來手工檢查和糾正地圖。Google方面并未透露小隊的具體人數,而公司外部也只有很少人見過該程序被投入使用。Nick Volmar是地圖團隊中最富創造力的操作員之一,他演示了該系統。
操作員所看到的看起來很像是Google地圖的混合衛星地圖,但上面的顏色線和符號則不常見。道路會根據行進方向以不同顏色標記,紅綠箭頭則指明了某個既定交叉路口可能要轉彎。Volmar熟練地點擊屏幕一側的方框,切換開關各種圖層,街景圖像中捕捉的交通標識就會出現或消失。
Volmar展示了如何通過點擊與拖拽衛星圖像的方式,修復一條失準道路。這看起來容易,甚至也許挺有意思,并且與編輯“開放街道地圖”的過程并無不同。但Volmar與其他操作員不僅每天要檢查數以萬計用戶上報的問題,并且還要根據需要修復它們。
一張地圖就展示了舊金山某條高速公路的道路優化情況,線寬即代表了交通流量。Google數年來一直在使用手機位置信號勘測交通狀況,Gupta也承認它還可以成為其他信息的良好資源,比如轉彎限制或單行道,但他拒絕對此詳細說明。Gupta說:“Google以多種方式使用定位,但除此之外,我能說的也沒有什么特別的。”
除了Volmar這種的操作員,Google還通過其“MapMaker”項目從平民那里得到制圖幫助。該項目于2011年啟動,現已在超過220個國家運作,目標是為發展中國家以及其他無法使用準確地圖源的地區改善Google地圖,Gupta表示:“我們招募用戶添加對他們來說重要的制圖信息,我們提供工具以及衛星圖像,他們可以進行糾正。”
在離家更近的地方,人們可以貢獻公園、小路、以及其他街景勘測車無法到達之處的數據。McClendon說:“我通過GPS系統記錄了上山的路線,然后添加了更精確的小路數據。”
看著工作人員操作Atlas,你會有一種“深圖”的感覺,當你打開Google地圖時,在實際看到的圖像之下還存在著更多數據,不僅是道路布局,而且還關乎互相連接的邏輯。信息不只關于建筑物的形狀,地圖只會變得愈加細致。
1.砍柴網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;2.砍柴網的原創文章,請轉載時務必注明文章作者和"來源:砍柴網",不尊重原創的行為砍柴網或將追究責任;3.作者投稿可能會經砍柴網編輯修改或補充。