cathryn0603
編者按:本文是百度Apollo一名自動(dòng)駕駛工程師對(duì)自動(dòng)駕駛的一篇見(jiàn)解文章。文章先講解了自動(dòng)駕駛的發(fā)展意義;然后從我 在那兒 ?周圍有什么?接下來(lái)會(huì)發(fā)生什么?我該怎么做?等方面展開(kāi)講解自動(dòng)駕駛技術(shù);最后以極客邦和百度Apollo聯(lián)合發(fā)布的自動(dòng)駕駛工程師技能圖為例,說(shuō)明了如何幫助非專業(yè)自動(dòng)駕駛領(lǐng)域的工程師轉(zhuǎn)行和進(jìn)入該領(lǐng)域。
2018年12月5日,Google旗下的Waymo推出自動(dòng)駕駛首個(gè)用于服務(wù)乘客的商業(yè)叫車服務(wù)——Waymo One,該服務(wù)在美國(guó)鳳凰城及其錢德勒、坦佩、梅薩和吉爾伯特4個(gè)郊區(qū)24小時(shí)運(yùn)行。乘客只需通過(guò)APP呼叫無(wú)人車,選定上下車地點(diǎn),然后通過(guò)自動(dòng)駕駛系統(tǒng)就可以方便地前往任何地方。車上沒(méi)有駕駛員,只有一塊HMI(人機(jī)交互界面)來(lái)告知乘客目前車輛的狀態(tài)、周圍情況以及后續(xù)路線。
從Google的自動(dòng)駕駛項(xiàng)目開(kāi)始再到如今的Waymo,其自動(dòng)駕駛技術(shù)在10年間取得了不小進(jìn)步。Waymo測(cè)試車?yán)塾?jì)公路行駛距離已達(dá)1000萬(wàn)英里,遍及美國(guó)25個(gè)城市,還有著100億英里的模擬行駛數(shù)據(jù)。而這些駕駛數(shù)據(jù)配合人工智能技術(shù)將無(wú)人駕駛帶到了我們身邊。
同樣,在北京的海淀公園18年也被改造成了全球首個(gè)AI公園,11月1號(hào)正式對(duì)外開(kāi)放。在這整個(gè)智能化公園中,最引人矚目的就是阿波龍自動(dòng)駕駛小巴。這款迷你小巴每輛可搭載6-7人,沒(méi)有駕駛座也沒(méi)有方向盤,等乘客落座系好安全帶,阿波龍就會(huì)自動(dòng)關(guān)上車門妥妥地起步。在行駛過(guò)程中,拐彎和掉頭之前會(huì)主動(dòng)降速,遇到前方有行人或障礙物,也會(huì)主動(dòng)減速避讓或者停車。
這些都是人類見(jiàn)證 歷史 的偉大時(shí)刻,也是邁向未來(lái)生活的開(kāi)始,標(biāo)志著一個(gè)新的時(shí)代正在悄然來(lái)臨。
普通 汽車 終將退出 歷史 舞臺(tái),可能就在不久的將來(lái), 汽車 即將成為我們可以放心托付自己生命的第一代自主式機(jī)器人。在歷經(jīng)了數(shù)十年不斷失敗的嘗試后,借助速度更快的電腦、更可靠的傳感器技術(shù)以及基于深度學(xué)習(xí)的新一代人工智能軟件, 汽車 可以獲得與人類相似的能力,在無(wú)法預(yù)測(cè)的環(huán)境中自主安全地駕駛。
為什么我們需要關(guān)注自動(dòng)駕駛? 不僅僅是因?yàn)檫@項(xiàng)具有偉大影響力的技術(shù)能夠替代司機(jī)提升交通出行的效率和安全性;更重要的是自動(dòng)駕駛會(huì)改變?nèi)祟惖纳罘绞?,讓人們重新享受出行的?lè)趣。
當(dāng)前,我們的 汽車 是非智能的,其標(biāo)準(zhǔn)的四個(gè)輪子、一個(gè)機(jī)身和一個(gè)發(fā)動(dòng)機(jī)的配置近100年來(lái)沒(méi)有了本質(zhì)性的改進(jìn),而世界上其它產(chǎn)業(yè)的根基你都發(fā)生著根本性的變化。 而得益于機(jī)器人技術(shù)和人工智能技術(shù)在近期取得的成就,平凡普通的 汽車 也即將進(jìn)化成自動(dòng)化移動(dòng)機(jī)器人。 目前, 汽車 的便利在一個(gè)世紀(jì)中不斷給我們帶來(lái)了自由、快捷,同時(shí)也帶了新的工作機(jī)會(huì)和社交機(jī)會(huì)。商業(yè)貿(mào)易也因此變得前所未有的方便。
但是,在獲得移動(dòng)便捷性的同時(shí)人們也付出了極高的代價(jià)。每年全球交通事故死傷人數(shù)近100萬(wàn),中國(guó)每年傷亡20萬(wàn)人左右;人類駕駛的 汽車 也帶了城市的交通擁堵和空氣惡化。粗略估計(jì),全球有十億由人類駕駛的 汽車 在陸地上漫游,對(duì) 汽車 的依賴已經(jīng)不可能減少,只會(huì)越來(lái)越多, 汽車 是我們現(xiàn)代生活不可缺少的一部分。
事實(shí)上,解決 汽車 引發(fā)系列問(wèn)題最好的方式就是讓它們變得智能。 當(dāng)AI接管人類駕駛員時(shí),無(wú)人 汽車 將給世界數(shù)十億人提供一種更安全、更簡(jiǎn)潔甚至是更方便的出行模式。在理想的未來(lái),我們的街道和高速路上會(huì)充滿成群的、分布緊密的無(wú)人駕駛 汽車 ,想魚群一樣,這些無(wú)人駕駛 汽車 會(huì)展現(xiàn)出驚人的防沖撞能力,在充滿行人的街道上機(jī)智而快速地穿行,在漫長(zhǎng)而空曠的高速路上以最經(jīng)濟(jì)的消耗方式靈活???。有些車會(huì)攜帶一輛名乘客,有些車完全沒(méi)有乘客,因?yàn)樗鼈兛赡芤ソ铀屯赓u或快遞。而坐在車?yán)锏娜藗?,也講有完全自由時(shí)間和私密的空間進(jìn)行任何事情,比如購(gòu)物、看電影和孩子享受親子時(shí)光。
自動(dòng)駕駛技術(shù)從人們開(kāi)始嘗試到現(xiàn)在其實(shí)已經(jīng)經(jīng)歷了近50年的 歷史 ,從上世紀(jì)70年代就有國(guó)外機(jī)構(gòu)和大學(xué)開(kāi)始研究自動(dòng)駕駛技術(shù)。
美國(guó)國(guó)防高級(jí)研究計(jì)劃署(DARPA) 在1984年研制出自主地面陸軍戰(zhàn)車項(xiàng)目,可以說(shuō)是真正自動(dòng)駕駛技術(shù)的開(kāi)端。當(dāng)時(shí)的技術(shù)還比較落后,只能通過(guò)固定規(guī)劃路線在動(dòng)態(tài)障礙物的情況下達(dá)到目的地。到了2004年,DARPA接連舉辦了3屆無(wú)人駕駛挑戰(zhàn)賽,可以說(shuō)真正拉開(kāi)了現(xiàn)代自動(dòng)駕駛的序幕,其中CMU(卡內(nèi)基梅隆大學(xué))、MIT(麻省理工學(xué)院)、Stanford(斯坦福大學(xué))等著名高校接連著力研發(fā)自動(dòng)駕駛技術(shù),將自動(dòng)駕駛的發(fā)展推向高潮。
而產(chǎn)業(yè)界, 最早在2009年Google成立X事業(yè)部開(kāi)始了自動(dòng)駕駛技術(shù)的研發(fā),緊接著 科技 公司、傳統(tǒng)車企都紛紛加入自動(dòng)駕駛這場(chǎng)技術(shù)競(jìng)賽中,不甘落后。 中國(guó)當(dāng)然也是其中重要的一員 ,無(wú)數(shù)技術(shù)精英、專家回國(guó)參與自動(dòng)駕駛研發(fā),百度、華為、騰訊、阿里等大公司花重金投入其中,每年招攬大批人才,高校的生源供不應(yīng)求,薪資也水漲船高。
2013年,美國(guó)機(jī)動(dòng)工程師協(xié)會(huì)(SAE)給出了車輛自動(dòng)化的標(biāo)準(zhǔn),分別是L0~L5。不同的Level所實(shí)現(xiàn)的自動(dòng)駕駛能力時(shí)逐層增加的。對(duì)應(yīng)的中文翻譯可以參見(jiàn)表格:
目前,自動(dòng)駕駛技術(shù)發(fā)展中, 科技 類公司主要尋求從L4級(jí)別自動(dòng)駕駛?cè)胧?,一步將智能化完成到一個(gè)非常高的程度;而大部分傳統(tǒng)車企目前主要是從L3級(jí)別入手,從高級(jí)輔助駕駛開(kāi)始逐漸往全自動(dòng)方向滲透。這兩種發(fā)展思路也是充分提現(xiàn)了目前各自的優(yōu)勢(shì),但大家的終極目標(biāo)都是希望實(shí)現(xiàn)L5的全自動(dòng)駕駛狀態(tài)。
下面,我們以Google的無(wú)人車為例,簡(jiǎn)單介紹L4級(jí)別自動(dòng)駕駛技術(shù)是如何構(gòu)成的。 Google時(shí)最早開(kāi)始研發(fā)自動(dòng)駕駛的公司,擁有最豐富的技術(shù)積累和最強(qiáng)的研發(fā)人員。但是無(wú)人駕駛系統(tǒng)的復(fù)雜性是遠(yuǎn)超人們想象的,經(jīng)過(guò)近10年的研究,目前也僅僅是試驗(yàn)性的推出了無(wú)人駕駛體驗(yàn)服務(wù)。無(wú)人駕駛系統(tǒng)主要由三部分組成:算法端、車端和云端。其中算法端包括傳感器、感知和決策等智能關(guān)鍵步驟的算法;車端包括機(jī)器人操作系統(tǒng)、各種計(jì)算硬件和車輛底盤硬件等;云端包括數(shù)據(jù)挖掘、仿真模擬、高精地圖以及深度學(xué)習(xí)訓(xùn)練等等。
通過(guò)這一套系統(tǒng)我們能夠解決無(wú)人車的四個(gè)關(guān)鍵問(wèn)題:我在哪?我周圍有什么?接下來(lái)會(huì)發(fā)生什么?我應(yīng)該怎么做?
定位問(wèn)題是無(wú)人車首先要解決的問(wèn)題,只有明白自身的位置才能最優(yōu)的開(kāi)往目的地。 定位需要依靠一種稱為高精地圖的技術(shù),該技術(shù)會(huì)將無(wú)人車要走的所有靜態(tài)環(huán)境進(jìn)行描述,包括車道線、行人斑馬線、標(biāo)志牌等等。這些靜態(tài)信息可以提供交通信號(hào)的關(guān)鍵信息,也會(huì)作為定位方案的錨定物對(duì)自身的位置進(jìn)行校準(zhǔn),比如通過(guò)攝像頭看到距離左邊標(biāo)志牌的距離是,那么在地圖中知道了標(biāo)志牌的坐標(biāo)也就知道了自身車輛的坐標(biāo)。同時(shí),還會(huì)依靠GPS/IMU等全局設(shè)備來(lái)定位自身位置,不過(guò)這可比我們目前智能手機(jī)里的GPS精度要求高很多,通過(guò)差分融合技術(shù)可以達(dá)到厘米級(jí)精度。
有了定位后,無(wú)人車的感知系統(tǒng)將通過(guò)傳感器和人工智能算法將周圍的障礙物位置、大小、狀態(tài)、類別等標(biāo)識(shí)出來(lái)。 目前主流L4級(jí)別的傳感器包括GPS/IMU、LIDAR、Camera、Radar等,LIDAR、Camera和Radar都是用于感知周圍障礙物的主要傳感器,分別在不同環(huán)境下能夠有不同的優(yōu)勢(shì)。這些信息猶如人類駕駛員的眼睛一樣看到周圍動(dòng)態(tài)環(huán)境物體,并將其識(shí)別出來(lái),而無(wú)人車會(huì)利用自己多傳感器和計(jì)算效率達(dá)到遠(yuǎn)超人類的水平,比如精準(zhǔn)識(shí)別車輛后方任何物體、同時(shí)關(guān)注左右兩邊的車輛狀態(tài),在黑暗狀態(tài)時(shí)可以通過(guò)激光雷達(dá)精準(zhǔn)識(shí)別。
無(wú)人車知道周圍動(dòng)態(tài)物體后,還需要能夠盡可能的預(yù)測(cè)這些物體的走向,包括行為預(yù)測(cè)和速度預(yù)測(cè)。 例如這個(gè)車是要左轉(zhuǎn)還是直行,這輛車會(huì)不會(huì)闖紅燈等等,匯入車流時(shí)速度是多少。這些問(wèn)題都將決定我們無(wú)人車后續(xù)應(yīng)該怎么走,如何避免碰撞發(fā)生危險(xiǎn)。當(dāng)然由于人的主觀意志具有很多不確定性,在人類司機(jī)和自動(dòng)駕駛司機(jī)混合的道路上,人工智能程序還需要學(xué)習(xí)人類的行為習(xí)慣和約定俗成的禮讓方式,這些都大大增加了無(wú)人車的難度。
最后一步就是根據(jù)上述信息綜合來(lái)選擇一條最適合無(wú)人車的道路,如同人類的大腦一樣對(duì)車輛最終的行為負(fù)責(zé),選擇最合適的方式達(dá)到目的地。 這需要考慮行車的體感、安全和快捷等因素,通過(guò)最優(yōu)化算法、搜索算法、蒙特卡洛樹(shù)采樣等多種算法來(lái)得到未來(lái)的駕駛行為,也有通過(guò)模仿優(yōu)秀老司機(jī)的駕駛行為等方式來(lái)提升駕駛性能等等。
上述四個(gè)問(wèn)題表面上僅僅是車輛端的問(wèn)題,但是其背后的技術(shù)棧是異常龐大復(fù)雜的,這些人工智能技術(shù)會(huì)用到云端的仿真系統(tǒng)、模型訓(xùn)練系統(tǒng)等等。 要做好其中任何步驟都是學(xué)術(shù)界長(zhǎng)期以來(lái)不斷積累而得,也是需要工程能力非常強(qiáng)大的工程師才能實(shí)現(xiàn)的高效算法。無(wú)人駕駛作為人工智能的一個(gè)重大應(yīng)用方向,不是某一項(xiàng)單一的技術(shù)可以實(shí)現(xiàn)的,它是一個(gè)目前人類技術(shù)巔峰的一個(gè)整合創(chuàng)新。需要有算法上的創(chuàng)新、系統(tǒng)上的融合以及云平臺(tái)的支持。那如此復(fù)雜的技術(shù)我們應(yīng)該如何入門,如何進(jìn)入這個(gè)領(lǐng)域?
自動(dòng)駕駛技術(shù)的發(fā)展目前最大的瓶頸不是傳感器的昂貴、不是產(chǎn)業(yè)發(fā)展不完善更不是公司投入不足,而是研發(fā)人才的缺乏。 目前我國(guó) 汽車 從業(yè)人員達(dá)到360萬(wàn),但其中技術(shù)人才不到50萬(wàn),占比不到15%。這其中雖然很難明確界定自動(dòng)駕駛?cè)瞬庞卸嗌?,但是可以想?jiàn)肯定不多。而且從自動(dòng)駕駛專業(yè)人才年薪動(dòng)輒幾百萬(wàn)上千萬(wàn),就可以知道人才有多緊缺。
我們需要更多的工程師和科學(xué)家進(jìn)入這一領(lǐng)域,將現(xiàn)有的技術(shù)進(jìn)行整合落地。但是如何幫助開(kāi)發(fā)者們進(jìn)入這一新興領(lǐng)域成了業(yè)界非常關(guān)注的事情,我們就以極客邦和百度Apollo聯(lián)合發(fā)布的自動(dòng)駕駛工程師技能圖為例,來(lái)說(shuō)明如何幫助非專業(yè)自動(dòng)駕駛領(lǐng)域的工程轉(zhuǎn)行和進(jìn)入該領(lǐng)域。先來(lái)看看這一份技能圖譜:
一個(gè)新的技術(shù)領(lǐng)域往往建立在當(dāng)前成熟技術(shù)的基礎(chǔ)之上,而自動(dòng)駕駛需要的技能種類繁多,我們需要首先全面了解整體技術(shù),再選擇感興趣的方向進(jìn)行深入挖掘。 從這份技能圖譜可以看到包括兩大主要模塊,首先是基礎(chǔ)層, 就是Apollo開(kāi)發(fā)會(huì)用到的共性的語(yǔ)言和編程方式; 其次是自動(dòng)駕駛技術(shù)層 ,既包括感知、決策規(guī)劃、智能控制、End-to-End等自動(dòng)駕駛核心能力,也包括硬件,比如GPS、雷達(dá)、傳感器、車輛相關(guān)的知識(shí)和技能。
JasonZhou520
【太平洋汽車網(wǎng)】自動(dòng)駕駛需要機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、NLP、計(jì)算機(jī)視覺(jué)、機(jī)器推理和強(qiáng)大的人工智能等技術(shù)。高度自動(dòng)駕駛是L4和完全自動(dòng)駕駛是L5。
今天的社會(huì)正變得越來(lái)越以多媒體為中心、依賴數(shù)據(jù)和自動(dòng)化。自動(dòng)駕駛技術(shù)正在道路、海洋和太空中普及。自動(dòng)化、分析和智能正在從人類轉(zhuǎn)向“特定于機(jī)器”的應(yīng)用。計(jì)算機(jī)視覺(jué)和視頻將在未來(lái)的數(shù)字世界中扮演重要角色。數(shù)以百萬(wàn)計(jì)的智能傳感器將通過(guò)人工智能嵌入汽車、智能城市、智能家居和倉(cāng)庫(kù)。此外,5G技術(shù)將成為一個(gè)完全互聯(lián)的智能世界的數(shù)據(jù)高速公路,或許將從人到機(jī)器,甚至機(jī)器人代理等一切事物連接起來(lái)。
一個(gè)多世紀(jì)以來(lái),汽車行業(yè)一直是一個(gè)主要的經(jīng)濟(jì)部門,它正朝著自動(dòng)駕駛和聯(lián)網(wǎng)汽車的方向發(fā)展。汽車正變得越來(lái)越智能化,對(duì)人類操作的依賴也越來(lái)越少。車輛與車輛(V2V)和車輛與萬(wàn)物互聯(lián)(V2X),即來(lái)自傳感器和其他來(lái)源的信息通過(guò)高帶寬、低延遲和高可靠性的鏈路傳輸,為全自動(dòng)駕駛鋪平了道路。自動(dòng)駕駛背后最引人注目的因素是死亡和事故的減少。認(rèn)識(shí)到90%以上的汽車事故是人為失誤造成的,自動(dòng)駕駛汽車將在實(shí)現(xiàn)汽車行業(yè)“零事故”、“零排放”和“零擁堵”的宏偉愿景中發(fā)揮關(guān)鍵作用。
唯一的障礙是車輛必須具備看到、思考、學(xué)習(xí)和駕馭各種駕駛場(chǎng)景的能力。
與此同時(shí),隨著嵌入式系統(tǒng)、導(dǎo)航、傳感器、視覺(jué)數(shù)據(jù)和大數(shù)據(jù)分析等領(lǐng)域的最新進(jìn)展,也見(jiàn)證了車輛和移動(dòng)邊緣計(jì)算的智能化程度不斷提高。首先是先進(jìn)的駕駛輔助系統(tǒng)(ADAS),包括緊急制動(dòng)、倒車攝像頭、自適應(yīng)巡航控制和自動(dòng)停車系統(tǒng)由汽車工程師協(xié)會(huì)(SAE)定義的6個(gè)自動(dòng)駕駛級(jí)別被引入后,全自動(dòng)汽車有望逐步實(shí)現(xiàn)。
(圖/文/攝:太平洋汽車網(wǎng)問(wèn)答叫獸)
優(yōu)質(zhì)工程師考試問(wèn)答知識(shí)庫(kù)