Apollo Fuel 技术分享:我们都知道,数据在整个无人驾驶技术研发里处于非常重要的位置。它不是我们经常提到的定位、感
知、预测、规划、控制、仿真等关键算法模块,但是它跟所有这些模块打交道。所以我们把这个项目
叫做Apollo Fuel,因为数据对无人驾驶来说就像燃料对车一样驱动每个模块的发展。
▲数据闭环
这个是典型的数据闭环。最左边车子出去测试,录制数据回来,然后工程师对其中的问题进行
Debug,Profiling,修代码,部署到车上继续测试。虽然无人驾驶是人工智能的集大成者,但是也
免不了有很多这种Case by case的工作。
车子采回来的数据非常重要,它包含了非常多的量化信息。这应该是有史以来对现实世界最全面的数
字化表示。物体变成了一个个的点,颜色,位置,速度等都数字化。从中可以得到大量的标注数据,
供计算机学习。然后把模型部署到车上去,让它开得更好。
数据标注有两种,一种是自动标注,比如障碍车的轨迹预测,需要预测2秒后的状态,在录制的数据
里可以确切地知道它2秒后的状态,这就是Ground truth。Apollo的数据管线可以做到全自动,从增
量数据中抽取feature,训练,在仿真引擎里验证,然后部署。另一种是人工标注,需要把原始数据
进行一些处理,得到标注公司接受的格式,付钱,然后拿到标注数据。比如图像、点云,很多需要人
工标注