DeepScale是硅谷一家專(zhuān)注于自動(dòng)駕駛感知技術(shù)的公司,其CEO Forrest Iandola在本月接受新智駕采訪時(shí)表示,他們能將深度學(xué)習(xí)同時(shí)用于攝像頭以外的傳感器數(shù)據(jù)上,如雷達(dá)與激光雷達(dá),并在較為廉價(jià)的嵌入式設(shè)備上提供感知解決方案。
新智駕:你怎么定義DeepScale和它在自動(dòng)駕駛行業(yè)的位置?
Forrest:我們是一家軟件公司,取決于與哪家OEM合作,我們會(huì)成為T(mén)ier 1或Tier 2供應(yīng)商。有時(shí)與車(chē)廠合作,有時(shí)也與T1合作,向車(chē)廠提供完整的解決方案。兩種典型的情況。我們不是開(kāi)發(fā)自動(dòng)駕駛整體解決方案,而是只開(kāi)發(fā)感知系統(tǒng)軟件,是自動(dòng)駕駛構(gòu)成的一部分。
新智駕:多傳感器的前融合在學(xué)術(shù)研究上是一個(gè)相對(duì)成熟的領(lǐng)域嗎?
Forrest:研究的人相對(duì)比較少。深度神經(jīng)網(wǎng)絡(luò)是一個(gè)有研究很多的領(lǐng)域,在語(yǔ)音識(shí)別、目標(biāo)檢測(cè)、圖像及視頻識(shí)別、文本分析上都有很多應(yīng)用。但傳感器的融合在DeepScale之外,還主要是人工設(shè)計(jì)的算法,很少用深度學(xué)習(xí),甚至沒(méi)有用機(jī)器學(xué)習(xí)的方法?傮w上雖然已經(jīng)有了一些研究,但仍有很多開(kāi)放的問(wèn)題待解決。
新智駕:那有待解決的問(wèn)題還有哪些?
Forrest:除了很多方法沒(méi)有利用原始數(shù)據(jù),這會(huì)帶來(lái)一定的局限外,如何做到傳感器的時(shí)間同步也是一個(gè)重要問(wèn)題。傳感器有不同的采樣速率,一個(gè)傳感器可能是每秒30次的采樣,另一個(gè)可能是40帆每秒,在如何融合上我們有一些成果了。時(shí)間序列神經(jīng)網(wǎng)絡(luò)(Time Series Neural Network)幫了很大的忙,RNN(遞歸神經(jīng)網(wǎng)絡(luò))也很有用,解決了不少問(wèn)題。
新智駕:雷達(dá)上的原始數(shù)據(jù)你們用的是頻譜(Spectrum)嗎?如何做數(shù)據(jù)融合?
Forrest:第一步是我們與一些雷達(dá)公司有合作,他們會(huì)為我們提供原始數(shù)據(jù)。這方面我們有一些進(jìn)展,用機(jī)器學(xué)習(xí)的方法取得了一些不錯(cuò)的成果?梢酝嘎兜氖,這有點(diǎn)像語(yǔ)音識(shí)別,你可以用原始波形(Wave Forms),或者用FFT(快速傅里葉變換)做一系列的處理,再喂給神經(jīng)網(wǎng)絡(luò),這是一個(gè)還沒(méi)解決的問(wèn)題。
新智駕:你們對(duì)傳感器的配置沒(méi)有具體要求?
Forrest:我們?cè)谂渲蒙虾莒`活,主要看合作的OEM想達(dá)到什么樣的效果。在城市路段和高速上所用傳感器是不一樣。想達(dá)到什么樣的功能,想要系統(tǒng)多可靠,這決定了用什么樣的傳感器。
新智駕:讓業(yè)界采用你們的方案是否存在哪些阻礙?
Forrest:有不少公司開(kāi)發(fā)出了車(chē)載的智能傳感器,里面也集成了處理算法,對(duì)這些公司來(lái)說(shuō),我們的技術(shù)是顛覆性的(Disruptive)。車(chē)廠也不可能同時(shí)用這兩種方法,所以我們?cè)谂c汽車(chē)行業(yè)對(duì)用新技術(shù)做計(jì)算感興趣的公司合作,希望能將計(jì)算中心化。
新智駕:是因?yàn)榱?xí)慣了傳統(tǒng)的方案而不愿意接受新的技術(shù)?
Forrest:這對(duì)每家公司來(lái)說(shuō)都不一樣。如果對(duì)精度和系統(tǒng)安全沒(méi)那么敏感,就不需要。
新智駕:那是否意味著你們更偏向于L4-5級(jí)別的全自動(dòng)駕駛,而不是L2-3級(jí)?因?yàn)楹笳咭呀?jīng)有Mobileye這樣的公司了?
Forrest:我們L2-5級(jí)別的方案都做。L2-3的定義很廣泛,現(xiàn)在L2級(jí)自動(dòng)駕駛的功能和它未來(lái)有的功能差別很大,比如像緊急制動(dòng)系統(tǒng)這樣的功能就還不完美,還有很多工作要做。車(chē)廠也對(duì)有更多的安全功能很感興趣。我們也不是想挑戰(zhàn)Mobileye,但在L2-3領(lǐng)域還有很多待解決的問(wèn)題。在L4-5級(jí)上,會(huì)加入更多的傳感器,會(huì)面向更多的場(chǎng)景,而我們系統(tǒng)的好處是對(duì)傳感器的改變適應(yīng)性很好,我們可以支持高端和低端的傳感器,且不用做太多的前期開(kāi)發(fā)。
新智駕:你們開(kāi)發(fā)過(guò)程中遇到的主要挑戰(zhàn)是什么?
Forrest:取決于自動(dòng)駕駛車(chē)輛要達(dá)到什么樣的功能,我們的一個(gè)目標(biāo)就是要達(dá)到相應(yīng)的感知精度要求。另外就是要在車(chē)規(guī)級(jí)的硬件和處理器上完成實(shí)時(shí)計(jì)算。DeepScale的一個(gè)優(yōu)勢(shì)是我們擅長(zhǎng)重新思考神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì),以在更小的處理器上運(yùn)行。英偉達(dá)等GPU公司在PC和服務(wù)器上,以及未來(lái)的汽車(chē)上都有很好的應(yīng)用。但也有一些應(yīng)用場(chǎng)景,就算是英偉達(dá)最便宜的芯片也不能滿(mǎn)足OEM的需求,但我們能將深度神經(jīng)網(wǎng)絡(luò)運(yùn)行手機(jī)和車(chē)載硬件上。這也是我們的一個(gè)特點(diǎn),很多公司或者在GPU上做深度學(xué)習(xí),或者在其它硬件上做非深度學(xué)習(xí)的傳統(tǒng)的計(jì)算機(jī)視覺(jué)。
新智駕:你們現(xiàn)在主要支持哪些計(jì)算平臺(tái)?
Forrest:與我們對(duì)傳感器的要求不多,可以換到新的傳感器而不用做過(guò)多的開(kāi)發(fā)一樣,我們自己的深度神經(jīng)網(wǎng)絡(luò)軟件框架可以移植到不同的處理器平臺(tái)上,比如高通、英偉達(dá)、TI等,我們未來(lái)會(huì)運(yùn)行上所有的平臺(tái)上。
新智駕:現(xiàn)在你們深度神經(jīng)網(wǎng)絡(luò)的功能有哪些?
Forrest:目前我們主要關(guān)注的是物體檢測(cè),包括物體的種類(lèi)、運(yùn)行路線、距離等信息;還可以分析3D點(diǎn)云,即環(huán)境的3D形狀是什么,從一個(gè)攝像頭到多個(gè)傳感器的數(shù)據(jù)都可以分析。還有Occupancy,也就是道路上可以行駛的空間。
新智駕:你如何看待以攝像頭或激光雷達(dá)為主的自動(dòng)駕駛方案?
Forrest:我是一個(gè)很務(wù)實(shí)的人,我覺(jué)得更多的傳感器意味著更安全。各種不同的技術(shù)路徑都有自己的價(jià)值,但重要的是取決于想要做什么和達(dá)到什么樣的效果。如果只是做Demo,只想在限定區(qū)域內(nèi)運(yùn)行,可能一個(gè)攝像頭就夠了,如果是要解決安全問(wèn)題并且要量產(chǎn),不確定。
新智駕:你們未來(lái)的主要工作是什么?
Forrest:招人,軟件開(kāi)發(fā),獲取更多數(shù)據(jù),尋求更多合作都是。在一個(gè)漂亮的Demo與量產(chǎn)之間,還存在很大的鴻溝,安全性上也需要不斷提升。
(責(zé)任編輯:admin)