首頁> 媒體報道> 景馳CEO韓旭獨家專訪:2020年量產不是夢

景馳CEO韓旭獨家專訪:2020年量產不是夢

來源:本站 | 2018-03-20 10:51

韓旭,博士畢業于美國伊利諾伊大學香檳分校,師從美國和中國四院院士——計算機視覺權威Thomas Huang教授。博士畢業后加入美國密蘇里大學任博士生導師、終身教授,并擔任計算機視覺和機器學習實驗室主任。

 

在校期間,韓旭領導的團隊,參加了多項國際圖像識別大賽,獲得多次第一。他主持開發的DeepSpeech2 被MIT Tech Review評為2016十大技術突破之一,他曾擔任百度自動駕駛首席科學家,現在是景馳科技的CEO和聯合創始人。

 

景馳科技CEO、聯合創始人 韓旭

 

古人常說,學而優則仕,從一個初出茅廬的青蔥小子,到國際知名大學的終身教授,他已經完成了人生的蛻變。

 

但,缺乏挑戰的人生,即使爬的再高也是無趣的。從博士畢業開始,韓旭就帶領一個數人的小團隊進行科研項目的研究,數年之后,他手下的人員規模,已經擴張到上百人。可是在他的內心里,裝著更大的世界。

 

近日,韓旭接受了《高工智能汽車》的獨家專訪。

 

從視覺到語音,從學者到技術主管

 

韓旭的主要研究方向是計算機視覺與機器學習,在2013年的時候,他就帶領團隊在ImageNet物體檢測大賽、人臉識別大賽中,取得了相當優異的成績。

 

于他而言,參加世界級的大賽,不僅僅是證明實力的過程,同時作為世界范圍內最早使用深度學習做視覺識別的那一批人,他以及他的團隊成員,后來都成為了業內的佼佼者。

 

這番經歷,帶給韓旭的,既有對計算機視覺技術先進性和敏感性的理解,也有對該技術局限性的深層次認識。韓旭坦言,作為一名視覺識別領域的老兵,他深知視覺方案的優缺點。

 

計算機視覺有自己短時間內解決不了的難題:在一些場景下,物體識別與檢測很不穩定,因此極大的限制了視覺方案的可靠性和使用場景的廣度。現階段無法解決這些難題,也因此,LIDAR+攝像頭+毫米波雷達的自動駕駛方案,在公司創立伊始就定了下來。

 

2014年,韓旭從學者的身份轉換到了高科技公司的項目帶頭人,他進入百度美研人工智能實驗室,進行前端技術的探索研究。

 

由于初期沒有視覺方面的項目,他就受命開發基于深度學習的端到端中文語音識別系統(DeepSpeech2)。對于韓旭而言,從視覺到語音識別,專業上是跨界,但越有挑戰的事情越有魅力,他絲毫不擔心。

 

語音識別跟圖像識別,在技術原理上有相似之處,都是對參照物知識元素的提取,只是語音是連續的,它需要依托更多的語音模型和深度學習模型,比如語音的上下文環境。要讓機器聽懂人類的語言,首先是要能夠清晰的識別語音,即語音轉換成文字,其次是解析文字含義。

 

完成第一步需要的是多是技術上的處理,而完成后一步,則需要讓機器理解語義:文字的意義不只是表面的意思。

 

誠如每一個漢字,在字典上的釋義就有多種,不同的語境下,不同的說話語氣,所表達的意思都千差萬別。要讓只識“0和1”的機器,明白同一個句子不同的意思,靠的就是上下文的環境,達到這一目標,背后所依賴的就是深度學習的力量。這個系統在單句上下文的情況下,實現了超過人類認知水平的識別率,并被MIT Tech Review評為2016十大技術突破之一。

 

沒有GPS信號怎么辦?

 

景馳的無人駕駛系統,是以LIDAR+視覺+毫米波的融合方案,系統在關鍵的地方有冗余的安全設置,比如供電、剎車、運算系統等等。常見的單顆64線LIDAR的方案,并不是唯一,還有其它的方案,只是出于商業機密的考慮,最新的技術方案不便示人。

 

  • 1
  • 2
  • 3
  • 北京聯創永宣投資管理集團股份有限公司

    中國 北京 朝陽區宏泰東街綠地中心D座16層1601室 郵編:100102

    電話: 86-10-6528 8289 傳真: 86-10-6528 0062 或掃描右側二維碼關注:聯創資本 微信公眾號

    花粉之国彩金