北京科技新闻网移动版

主页 > 微商攻略 >

奇点汽车黄浴博士谈无人驾驶:Deep Learning在自动驾驶规模的应用

近日,全球计算机视觉与人工智能规模顶级科学家,奇点汽车美国公司总裁黄浴博士在上海大学宣布了名为《Deep Learning for AutonomousDriving》(深度学习在自动驾驶规模的应用)的出色演讲。黄博士表态:“自动驾驶是一块具有挑战性的自动智能应用规模,很多研究对付实现汽车的自动驾驶是十分有须要的。

黄浴博士曾任百度美国研发中心自动驾驶资深软件架构师,还曾在Intel总部、三星电子美国研发中心、华为、汤姆逊等多家著名的跨国技术公司任职,在人工智能规模有着富厚的经验和独到的见解。黄浴博士曾说过:“汽车时代的未来是智能汽车”,本场讲座,黄浴博士针对自动驾驶的技术算法、市场前景和价值及未来计划进行了深入的探讨。

1

图1:黄浴博士图片

身处硅谷多年的黄浴博士,切身感觉到近年自动驾驶作为厘革的焦点驱动力正在加速汽车财富智能化。他表态,跟着人工智能以及深度学习技术的成熟,所衍生出的自动驾驶技术,不只是当前全球汽车与智能化出行的成长偏向,更是各大车企争相抢夺的战略制高点。自动驾驶作为汽车财富未来转型升级的重要偏向,背后复杂的市场空间,使其备受成本热捧,成为汽车财富下新的“蓝海”。

中国汽车市场一直对新技术保持拥抱开放的态度。自2016年起,人工智能,物联网,高性能计算等一系列新信息技术的产出,都为自动驾驶的成长增砖添瓦。外界曾纷纷揣摩,自动驾驶在中国市场的成长前景或者是黄浴博士插手奇点汽车主要原因之一,在这里,他将所学付诸实践,实现商业落地。

黄浴博士的本次演讲干货满满,从理论架构到应用落地,给学子及与会人员带来了一场科技大餐。他环绕自动驾驶的观念和分级、深度学习在自动驾驶实现中的应用展开。视觉部门包罗障碍物检测与识别、交通符号和交通灯(红绿)的探测识别、车道线和标志的识别等,详细论述了对付传感器的成果与职能,包罗标定与融合,以及场景支解、方针跟踪、驾驶员行为模型、end-to-end学习、驾驶监控等。

自动驾驶主要分为感知,计划和控制三大模块,感知层面,以各类传感器,例如激光雷达,毫米波雷达以及超声波雷达,高精度舆图以及V2V车联网技术,完成对车辆周围情况的感常识别和对车辆自身精准定位;计划层面,通过感知层收集到的信息,对下一步动作进行计划,选择公道的路径,行为以及活动;控制层面,将决策控制信息与车辆底层控制系统深度集成,通过线控技术完成执行机构的电控化,到达真正的自动驾驶。另外,另有一种难度较大的端到端(end-to-end)深度学习方案,可直接通过接受传感器,简化系吐澉程,降低计算需求,从而实现自动驾驶。

2

图1:自动驾驶研发路径和研究偏向

黄浴博士比较PPT内容,详细的论述了自动驾驶的框架。“各人可以看到,硬件部门主要是传感器,有的时候还可以插手一些V2V,车的定位通过通信和执行器实现的,执行器可以作为独立控制。软件部门,车身是自带软件部门的,就是我适才提到的感知、计划和控制。‘感知’就是对周围情况的认知,包罗静态和动态。分成两部门,一部门是定位,就是你要知道你的车在什么地域。这个定位技术也有许多,大部门是通过舆图来定位的,也有一些通过路标等各类信息来实现定位。感知的另一部门是障碍物检测,即动态和静态物体的识别“

3

图2:自动驾驶

黄浴博士又提到,“当今主流自动驾驶路线主要有两个,第一类像特斯拉这样的成车厂商,一般都是从L2开始涉及自动驾驶规模,大多车企推出的大多是L2或介于L2与L3之间的自动驾驶汽车。第二类是像谷歌、百度等互联网企业在直接从L4入门,进入自动驾驶高等的分带,它实际上就是说我不需要考虑驾驶员的问题,我考虑的是怎么让机器来学习怎么驾驶。

聊到计算视觉及时下对这项技术的主流应用,黄博士说“计算视觉是一个从二维世界往三维世界的一个逆历程,实际上是一个病态问题。从70年代的计算视觉规模这个问题就袒露出来,各人始终在想步伐去解决这个逆历程,它跟图形学正好是相反的,图形学是通过三维空间的模型来发生二维的图形,所以图形学只要计算量够,它是没问题的,它可以算出来。但是计算机视觉就是说它不只仅是一个计算问题,它照旧一个逆历程,有时候那个解是不不变的。 我举个例子,或许2000年阁下,微软用了PrimeSense公司(厥后被苹果收购)的技术,推出了叫Kinect的产物。那个时候叫RGB-D传感器,实际上它是2.5维的,2.5维的传感器数据使计算机视觉的难度降低了许多多少。遗憾的是,普遍的2.5维传感器一般都照不远。Kinect根基上最多只能在五~六米范畴事情,就是增强型的话也最多到十来米远。但是,对车,那是底子不可的,车不行能用这个对象检测周围情况。目前有用RGB-D传感器的车企,或许只是将它放在车前比力低的地域,用它照路面来监测一些好比车道线大概很是近的障碍物,显然这种对象只能在低速的环境下使用。

“所以谷歌,包罗百度他们回收的是激光雷达,激光雷达都是通过发射激光然后接受回波来重建三维的空间。每个点的点上它有三维的坐标,甚至另有反射值。反射值可能会按照你的质料的差异有所差异,有的时候这个反射值也能发挥感化。所以谷歌的做法就是通过激光雷达来作为主要的障碍物检测。那么相机用来干什么?相机主要是用来做一些激光雷达做不了的工作。好比说可以做交通红绿灯检测,可以做交通符号的检测,然后还可以做一些警察的手势阐明,好比说遇到前面的路已经堵了,大概要说要求拐弯了,就是说这块路已经封了,他就会在那儿帮你做一些指导,他们用相机来做。”关于激光雷达和相机黄浴博士给出上述解释。

据报道,奇点汽车初代量产车型奇点iS6上市时能实现L2级此外高级帮助驾驶能力,包罗合用全速度的自适应巡航、车道保持、告急制动、自动泊车、盲区检测等十余项成果。奇点汽车方针于2018年内将自主驾驶算法提升至L3(SAE尺度),场景包罗高速公路的自动驾驶,以及有限的城区门路自动驾驶等。

(责任编辑:北京IT资讯)