自动驾驶的未来,是激光雷达还是视觉识别?
lijianrong | 2020-10-27 14:33
有一天,局长开着一台Model 3去喝茶,朋友见到我的车,第一时间就问:“敢不敢在高速路上用自动驾驶啊”,局长毫不犹豫的说:“不敢”,然后发了以下这幅图给他看。
这是在台湾嘉义的一起事故,一辆 Model 3 在高速公路上撞上了一辆侧翻的大货车。
司机当时开着Autopilot,时速在110km/h,当司机留意到货车,想要接管刹车时,已经太迟了,所幸没有造成人员伤亡。
朋友看了之后很惊讶,“Autopilot不是很牛的吗?怎么就撞上去了呢?”
是很牛啊,可它并不完美!
事后经分析指出,由于大货车是白色,有比较强烈的阳光反射,影响了这辆特斯拉Model 3的摄像头识别。
除此之外,调查显示特斯拉Model 3的视觉算法训练数据存在局限性。一般自动驾驶的视觉训练逻辑只能识别到车辆后部、侧面 和 头部,显然特斯拉的工程师没有想到有一天系统需要识别货车车箱的顶部。
简单来说就是这台车“走漏眼”了。
没错,现在的汽车都有“眼睛”!
今天,我们就来聊一下汽车的两种眼睛,激光雷达(Lidar)与计算机视觉识别(computer vision)。
首先我们来看看特斯拉跟激光雷达还有计算机视觉识别的轶闻。
在特斯拉CEO马斯克眼中,激光雷达是一种落后的东西,他在2019年4月曾经说过:“激光雷达和高精度地图都是自动驾驶中错误的解决方案, 只会减慢自动驾驶商业化的速度。如果你只是在限制区域行驶, 那也不能叫做自动驾驶。”
计算机视觉系统的工作原理看上去很简单,仅需要用摄像头跟毫米波雷达对周边的视觉信息进行收集,然后再对收集到的信息进行深度学习处理,将这些信号与已知的物体进行匹配再最终作出决策。
然而,这一切都要借助强大的硬件作为支撑。
比如特斯拉所使用的车机系统,号称“全球最先进的自动驾驶计算机”,其所使用的芯片有60亿个晶体管,每秒钟可以处理2,300帧图像,并以100瓦的功耗输出144 TOPS的算力。
按照这种思路,拥有摄像头+毫米波雷达+数据+神经网络,就能对车辆进行很好的训练。
同时有数以十万计的车主为特斯拉数据库提供大量数据支持,凭借这样的数据量可以覆盖绝大部分的道路,这也成为了特斯拉挑战激光雷达的资本。
而尽管马斯克在多个公众场合表示特斯拉不会使用激光雷达和高精地图。
但近日就有博主 @Greta Musk 在推特上连续爆料,称特斯拉的 FSD 存在「作弊」情况,指出其实特斯拉是有使用激光雷达和高精地图系统的。
“FSD Beta测试版很明显使用了预先加载的高清地图,看左边的那个路口,已经预先显示了。”
正常应该是去到那个地方收集了数据进行分析后,才会有显示。
与此同时,有小伙伴在路上拍到特斯拉车顶上装了个类似激光雷达的东西。
那有童鞋问,既然马斯克那么抵制激光雷达,是不是这种设备就一无是处了呢?
当然不是。
像目前丰田,福特,通用汽车这些传统汽车大厂都押宝在激光雷达上,那自然是有它的独到之处的。
激光雷达实际上是一种工作在光学波段(特殊波段)的雷达,它的优点非常明显。
第一,是具有极高的分辨率:激光雷达工作于光学波段,频率比微波高2~3个数量级以上,因此,与微波雷达相比,激光雷达具有极高的距离分辨率、角分辨率和速度分辨率(下图为两者的对比图)。
第二,抗干扰能力强:激光波长短,可发射发散角非常小(μrad量级)的激光束,多路径效应小(不会形成定向发射,与微波或者毫米波产生多路径效应),可探测低空/超低空目标。
第三,获取的信息量丰富:可直接获取目标的距离、角度、反射强度、速度等信息,生成目标多维度图像。
第四,可全天时工作:激光主动探测,不依赖于外界光照条件或目标本身的辐射特性。它只需发射自己的激光束,通过探测发射激光束的回波信号来获取目标信息。
既然有那么多好处,那马斯克为什么要反对呢?
首先,马斯克在多个场合中抨击激光雷达“笨重”,“丑陋”,“完全没有必要”。
这个也是激光雷达的一大缺点,现阶段大家很难把其体积缩小,在车顶上的位置比较突兀,这直接影响了量产化的进行,所以现在我们还没有看到激光雷达系统安装在量产车上。
而特斯拉只需要装一个小摄像头和几个毫米波雷达。
其次,我们知道两种方式都是车辆对外界感知的手段。
但利用摄像头的方式要比激光雷达便宜得多,比如Waymo在2019年所销售的 Laser Bear Honeycomb价格为7500美元,而特斯拉model 3车窗上的那组三摄像头模块(下图)才65美元。
最后是源自于两种不同的感知方式。
局长在前面讲到,激光雷达是通过主动探测的方式进行大范围的扫描,而且由于激光光束更加聚拢,精度上比摄像机加毫米波雷达的组合要更高。
而计算机视觉在原理上更像“眼睛”,摄像机拍到到什么,就分析什么,其拥有一个很大的优势就是物体分类,这也是为什么马斯克老说激光雷达多余的原因。
目前主流观点认为,激光雷达测量最为精准,而特斯拉的计算机视觉识别则精度尚稍欠缺。
康奈尔大学的研究人员发现(下图),如果摄像机收集到的数据以“上帝视角”呈现,那精度跟激光雷达的也没差太远,但如果是车头视角,则会出现较大偏差。
同时特斯拉人工智能和 Autopilot 视觉总监Andrej Karpathy对比了激光雷达方案和计算机视觉方案的优劣时表示:“某种意义上,激光雷达只是一种捷径。它避开了自动驾驶中视觉识别这个最重要的问题,给人一种“进步”的错觉。”
因受价格跟体积的限制,目前来看激光雷达还非常少地装配在量产车上,但局长相信只要未来解决上述两个难点,装配量飙升只是时间问题。
比如沃尔沃即将在2022年推出的Luminar激光雷达(下图),在体积以及外观上已经不成问题了。
而作为“敌方”阵营的计算机视觉识别,虽然成本费用低,但由于硬件自身的限制,性能和激光雷达相比还是有不少距离的。
幸运的是,以特斯拉,英伟达为代表的公司在自动驾驶芯片上所取得的巨大优势,弥补了计算机视觉识别技术和激光雷达的差距。
可以预见,未来两大阵营还会继续在智能汽车市场展开激烈较量,与此同时也将共同推动整个汽车行业的发展进步,让我们拭目以待吧!
局长点评:
局长认为,激光雷达也好,计算机视觉识别也罢,只是手段而已,最终还得看各自自动驾驶的表现。若计算机视觉识别不能推出更好的技术超越激光雷达,局长相信后者仍会承担着“桥梁”的作用,在自动驾驶领域存在相当长的一段时间。