如果沒有福特 10 億美元的大手筆投資,剛剛創(chuàng)辦 1 年的 Argo.AI 可能不會在這么短時間內(nèi)被行業(yè)熟知,并與 Waymo、Uber、Cruise 等公司并排出現(xiàn)在公眾視野里。不止如此,在將 10 億美元的投資陸續(xù)打入 Argo.AI 戶頭的同時,福特更將其近百位工程師團(tuán)隊全部投向了 Argo。面對摩拳擦掌的競爭對手們,某種程度上,可以說,福特要在 2021 年落地自動駕駛打車服務(wù),寶基本都押在了這個 200 來人的團(tuán)隊上。
Argo.AI 正在研發(fā)的是 L4 的自動駕駛技術(shù),和硅谷許多自動駕駛明星公司一樣,Argo 的團(tuán)隊陣容非常強大,CEO Bryan Salesky 最早曾任職于卡耐基梅隆機器人研究所下屬的國家機器人工程中心,之后又在谷歌擔(dān)任自動駕駛團(tuán)隊的硬件研發(fā)主管,聯(lián)合創(chuàng)始人 Peter Rander 則出自 Uber 高級技術(shù)中心,主導(dǎo)開發(fā)了 Uber 第一代自動駕駛原型車。
近日,Bryan Salesky 親自撰文,回憶了從 DARPA 城市挑戰(zhàn)賽至今的自動駕駛 10 年歷程,詳細(xì)介紹了自動駕駛行業(yè)以及包括 Argo.AI 在內(nèi)的自動駕駛公司們面臨的繁重工作,以及身處的困境。雖然已經(jīng)公布了 2021 年落地自動駕駛汽車的時間表,但 Salesky 對于自動駕駛?cè)嫱茝V開來的時間預(yù)期卻相當(dāng)保守,因為在他看來,實現(xiàn)自動駕駛遠(yuǎn)比多數(shù)人想象得要復(fù)雜得多,困難得多。
本文由新智駕編譯自 Argo.AI 官方博客 。
10 年前的加州沙漠里,11 個進(jìn)入決賽的車隊在史無前例的 60 英里比賽中競爭。不足 6 小時里,在不時有人類駕駛汽車干擾的情況下,機器人汽車必須安全快速地完成無人干預(yù)的駕駛?cè)蝿?wù)。這是 2007 年的 DARPA 城市挑戰(zhàn)賽,這場無人駕駛比賽無意中拉開了無人駕駛發(fā)展的序幕。在當(dāng)時,無人駕駛?cè)员徽J(rèn)為是天方夜譚,而現(xiàn)在回頭看,這場比賽正預(yù)示著一場漫長旅程的開始。通過小心管控范圍,DARPA 保證了某種程度的成功:參賽者同意了一系列嚴(yán)苛的交通規(guī)則,DARPA 則限制了行人和騎行車輛,為參賽團(tuán)隊減輕了一些負(fù)擔(dān)。不過,雖然做了這些簡化,團(tuán)隊要完成的任務(wù)依然相當(dāng)艱巨——在 18 個月里,他們基本是從頭開始,開發(fā)出了自己的自動駕駛系統(tǒng)。
DARPA 挑戰(zhàn)賽顯出了自動駕駛對先進(jìn)的計算能力和算法的強烈需求。當(dāng)時,我們大部分都依賴于基于特定規(guī)則的編程技術(shù),這意味著,10 年前的機器人系統(tǒng)更傾向于在限定場景里操作,在特定的道路環(huán)境里,操作者一般不會偏離既定規(guī)則太多。
Argo 的很多人都在機器人和自動駕駛領(lǐng)域從業(yè)超過 10 年,我們利用自己深厚的專業(yè)知識把這項技術(shù)呈現(xiàn)給大眾,其中也包括在 DARPA 城市挑戰(zhàn)賽中的所學(xué)。就在幾個月前 Argo.AI 的一周年紀(jì)念日上,我們已經(jīng)成為一個擁有 200 名成員的經(jīng)驗充足的團(tuán)隊,并已經(jīng)在匹茲堡和密歇根州東南部進(jìn)行了自動駕駛汽車測試。
我們面對的第一個挑戰(zhàn)是自動化智能系統(tǒng)的軟硬件商業(yè)化。在外部環(huán)境中,車輛、行人混雜,自動駕駛沒有與其共同遵守的一整套規(guī)則,要執(zhí)行起來非常困難。在夜晚和白天的真實場景里,惡劣天氣,不同的路形路況,都可能讓情況變得更糟。機器人系統(tǒng)開發(fā)者需要先有一系列簡化的基本設(shè)想,而環(huán)境的動態(tài)性為其帶來了更多矛盾和變量。
過去幾年里,部分由于計算能力的增強,這場游戲發(fā)生了很大變化,但也出現(xiàn)了一些復(fù)雜的新問題,我們目前仍然沒有找到解決辦法。計算機處理能力、存儲能力和人工智能都進(jìn)步了很多,不需要設(shè)置演示,計算機就可以推理出許多問題。我們可以進(jìn)行海量的數(shù)據(jù)學(xué)習(xí),以非常高的準(zhǔn)確率識別圖像,過濾傳感器中的異常數(shù)據(jù),找到最重要的核心因素。當(dāng)我們擁抱這些變化時,我們也非常清楚,沒有一個單個的工具、技術(shù)、算法能夠解決自動駕駛的所有問題。下面就是我們對于自動駕駛汽車的一些思考。
感知世界
傳感器還有很長的路要走。我們用了激光雷達(dá),它在光照條件差時也可以較好地工作,理解車輛周圍的三維世界,但不能識別顏色和質(zhì)地,所以我們又使用了攝像頭。攝像頭在光線微弱的情況下功能非常受限,同時也很難在各種需要的操作范圍內(nèi)都達(dá)到足夠的聚焦與分辨率。相對而言,雷達(dá)雖然分辨率較低,但是可以長距離識別行人速度。
這就是為什么我們在車上裝了這么多傳感器,他們可以實現(xiàn)優(yōu)劣勢互補。單個傳感器不能完全復(fù)制他們捕捉到的東西,計算機必須綜合多個傳感器的數(shù)據(jù),過濾出錯誤的和不一致的。將所有這些整合進(jìn)一個綜合強大的外部世界圖像里,再進(jìn)行計算處理,遠(yuǎn)比想象中困難。
開發(fā)一個性價比高、可維護(hù)的硬件系統(tǒng)挑戰(zhàn)更大。我們盡量以最小的代價在傳感器軟硬件方面進(jìn)行了創(chuàng)新,減少傳感器計算,提高識別范圍和分辨率。但如何達(dá)成這些互相沖突的目標(biāo),讓技術(shù)更可靠地提升,仍然是非常重要的工作。
理解世界
一旦自動駕駛汽車有了“看見”周圍世界的眼睛,下一步就取決于車輛自己了——識別物體類型,前方究竟是行人、騎行者、車輛,或只是一個廢棄物,以及物體是以什么樣的速度在移動。之后,車輛還必須判斷物體下一步可能的動作。
人工智能、機器學(xué)習(xí)、計算能力、云存儲等各個方面的提升,更新了很多舊的算法,也催生了新的算法。這些新工具在開發(fā)新算法方面起了很大作用,它可以篩選出傳感器每秒上傳的數(shù)百萬像素的信息,判斷物體位置、尺寸與相對速度。
我們工作的一部分就是開發(fā)算法,通過傳感器收集數(shù)百萬英里的真實場景數(shù)據(jù),再利用這些數(shù)據(jù)教算法探測道路上的其它物體,雖然嘈雜和錯誤的傳感器數(shù)據(jù)也帶來了很多困難。工具鏈和運營團(tuán)隊進(jìn)行了數(shù)據(jù)流和開發(fā)過程的管理。
我們早期取得的一些成果非常厲害,我們也非常清楚,最棘手的永遠(yuǎn)是細(xì)節(jié)。
車輛預(yù)測
我們開車時,會下意識地預(yù)測接下來幾秒內(nèi)道路上其它行人、車輛的反應(yīng),預(yù)想行人或許會亂穿馬路,車輛會突然加塞。細(xì)心的駕駛員都非常善于處理這類情況,控制速度,為道路上的異常突發(fā)事件提前做出規(guī)劃。駕駛員所擁有的這種在擁擠城市道路上快速應(yīng)變的能力,自動駕駛汽車同樣應(yīng)該具備。
我們必須開發(fā)一種算法,使自動駕駛汽車更深入理解道路參與者可能出現(xiàn)的行為。我們需要向技術(shù)灌輸這種“體貼”意識,保證汽車安全、可靠、有預(yù)見性地行駛。
例如,車輛需要知道什么時候為大卡車挪出位置,進(jìn)入另一個司機的盲區(qū)時應(yīng)該調(diào)整速度。同時,我們還必須開發(fā)出一種算法,讓車輛知道哪些時候它過于保守了,哪些時候需要在繁忙的交通中“推一下”,或者保持一種狀態(tài),讓其它行人車輛先做出正確反應(yīng)。計算機提取了所有信息,對它來說,不被擾亂學(xué)習(xí)錯誤模型非常重要,因為如果預(yù)估了一個錯誤行為,它本身的表現(xiàn)也會出現(xiàn)異常。
這是我們在建造預(yù)測模型時,必須實現(xiàn)的平衡。這種平衡也只能來自真實場景的駕駛案例。在這些案例中,我們可以學(xué)習(xí)預(yù)測微型演習(xí),后者被證明是衡量道路其它車輛、行人或物體可能出現(xiàn)的反應(yīng)的最主要指標(biāo)。
系統(tǒng)集成和測試
驅(qū)動自動駕駛汽車的軟件一般被稱為隨機系統(tǒng),這意味著其結(jié)果取決于用于傳感器隨機輸入的一系列探測圖案和模型,而不是連續(xù)的一系列輸入又輸出的數(shù)學(xué)等式。
從同一條路上開車經(jīng)過,你不太可能兩次都準(zhǔn)確地按一個速度行駛。自動駕駛汽車也是一樣,雖然一般而言,它們的一貫性會比人類駕駛員好一些。
測試隨機系統(tǒng)需要大量真實場景的數(shù)據(jù),這意味著我們必須收集數(shù)百萬英里的道路經(jīng)驗,才能教軟件自信地駕駛。(想象一下一個人要駕駛數(shù)百萬英里才能拿到駕照。)但不是所有里程都是在同等情況下建立的,因此“累積里程數(shù)”并不是一個具備足夠表現(xiàn)力的追蹤進(jìn)程的衡量標(biāo)準(zhǔn)。再想一下,你在一個僻靜的小鎮(zhèn)學(xué)習(xí)的駕駛技能,不可能轉(zhuǎn)化成在曼哈頓中心地帶的駕駛技能。
我們的算法通過復(fù)雜的數(shù)學(xué)與邏輯運算,將每秒數(shù)百萬的像素轉(zhuǎn)化成自動駕駛汽車所在的世界狀況。考慮到這些高維度輸入,我們就不能用單個可能的輸入組合進(jìn)行測試,因為這樣的話,需要測試的組合數(shù)以萬億計,會非常難辦,所以在使用測試汽車的駕駛里程時,我們需要找到更聰明的方式。我們創(chuàng)造了可以抓取正確里程的工具,這些里程充分覆蓋了車輛可能看到的現(xiàn)實場景,之后我們再用這些測試車輛的正確反應(yīng)。要達(dá)到這種平衡需要在目標(biāo)部署區(qū)域里收集非常大量的駕駛經(jīng)驗和數(shù)據(jù),而這個目標(biāo)部署區(qū)域又必須盡可能覆蓋各種復(fù)雜場景。我們也必須充分考慮各個場景里可能降低傳感器輸出的環(huán)境變量,例如天氣和光照情況。
我們成立了專門的物流和測試團(tuán)隊,可以進(jìn)行安全的自動駕駛汽車測試,另外我們還有一個專業(yè)分析和軟件工程師團(tuán)隊,正在開發(fā)數(shù)據(jù)流管理工具,這些讓我們在情景覆蓋方面有了更多信心。
要開發(fā)出一輛自動駕駛汽車,我們今天仍然處于非常早期的階段。那些認(rèn)為自動駕駛汽車在幾年或幾個月內(nèi)就可以滿大街跑的人,要么是對眼下的科技發(fā)展水平?jīng)]有充分的認(rèn)識,要么在技術(shù)的安全運用上沒有周全的考慮。對于我們這些在自動駕駛技術(shù)方面已經(jīng)投入很長時間的人來說,我們想要告訴你的是,這件事情非常困難,整個系統(tǒng)也非常非常復(fù)雜。
大家都知道,努力、創(chuàng)新、專注的團(tuán)隊可以解決很多難以想象的棘手問題。在 Argo,我們看到了這樣一件激勵人心的事所帶來的挑戰(zhàn),也正是這些挑戰(zhàn)驅(qū)動著我們利用前面 10 年的積累,邁向一個自動駕駛的全新時代。
我們正在采取一些較為實際的方法,在承認(rèn)沒有“銀色子彈”的同時,充分結(jié)合目前科技的發(fā)展水平。身處這樣一場漫長的游戲中,我們盡量避免大肆宣傳,而是希望以一種贏得全世界數(shù)百萬人信賴的偉大產(chǎn)品的形式,將這項重要技術(shù)帶向成熟。
(責(zé)任編輯:admin)