Baidu Apollo 点云融合定位

参考 Apollo2.0多传感器融合定位模块解析 及 Github 上 Apollo 5.0 版本代码。

Table of Contents


无人车需要精确的定位,精确是指厘米级,也就是说 10厘米 以内。









所谓 RTK ,指的是载波相位差分技术(Real time kinematic),实时处理两个测量站载波相位观测量的差分方法,将基准站采集的载波相位发给用户接收机,进行求差解算坐标。

百度为什么要自己实现 GNSS/RTK:

现在惯导芯片一般都会配一个板卡(NovAtel也卖这样的板卡),直接集成了RTK的定位结果。为什么我们还需要自己开发GNSS-RTK呢? 从系统的角度考虑,需要每个子模块都是可控的 ,举一个简单的例子,当给出一个定位结果偏了,但给出的方差很小,也就是置信度很高。我们是没办法知道原因的。

航迹推算(IMU,Odometry 等)


捷联惯性导航( SINS, strapdown inertial navigation system )



Baidu MSF(多传感器融合) 定位

Multi-Sensor Fusion.





点云定位主要包括 "XY 计算" 和 "Yaw 优化",Z 是通过定位地图来获取的。

Yaw优化用到了图像对齐(LK光流图像配准 forward addtive 方法),XY计算用了直方图滤波器(2D Histogram Filter Localization)。

XY 计算

XY 计算使用 SSD-HF(Sum of Squared Difference Histogram Filter)。

SSD 把每个激光点的反射值或者高度值和定位地图对应值相减,然后把差的平方加起来,每个度量值越小说明位置匹配的越好。

怎么匹配多个位置?我们用二维直方图滤波器,将其中心放在预测姿态(x0, y0),滤波器一般选择2121,那么搜索的范围就是2.6米 2.6米,需要计算441个位置的SSD值。

Yaw 优化




对于反射值和高度值,做匹配的时候怎么联合起来?比如:左边有一个路段,反射值和匹配值经过平均以后,得到的位置会偏的很多,这时高度值定位非常好。用固定的方法加在一块,仍然得不到很好的分布,所以我们采用了自适应融合的方式,也就是说 反射值和高度值分别计算直方图分布,由直方图分布的优劣来决定其权重





  1. 姿态更新,对陀螺仪输出的角速度进行积分得到姿态增量,叠加到上次的姿态上;
  2. 比力坐标转换,是从IMU载体坐标系到位置、速度求解坐标系(惯性坐标系);
  3. 速度更新,速度这一步需要考虑重力加速度的去除,得到惯性系下的加速度,通过积分得到速度;
  4. 位置更新,通过积分得到位置。

在惯性导航中,提到了导航方程的每一次迭代都需要利用上一次的导航结果作为初始值,因此在 使用惯导之前必须进行初始化 。初始位置和初始速度信息需要外部提供,一般是GNSS。

姿态对准是指得到IMU的roll, pitch, yaw;roll, pitch的对准过程一般称为调平:当车静止时,加速度计测量的比力仅由重力导致,可以通过f=C*g来求解;对于非常高精度的IMU可通过罗经对准的方式,车静止,通过测量载体系中的地球自转来确定载体的方位(yaw)。

对于车上使用的IMU,没那么高等级,一般采用两种方式:车直线跑起来,用从GNSS获取的速度方向来估计航向;第二种方式是 采用双天线GNSS,通过两个位置连线来计算航向

介绍完GNSS定位、点云定位以及惯性导航解算以后,我们看这几个模块怎么融合到一起。这里使用了Kalman滤波器的 松耦合 ,意思就是我们只用了位置、姿态和速度做融合。

我们使用松耦合的方式把惯性导航解算、GNSS定位、点云定位三个子模块融合在一起。松耦合的数据只有 位置、速度、姿态 ,紧耦合会包括GNSS的导航参数、定位中的伪距、距离变化等。

我们使用了一个 误差卡尔曼滤波器(error state KF) ,惯性导航解算的结果用于kalman滤波器的时间更新,也就是预测;而GNSS、点云定位结果用于kalman滤波器的测量更新。


这里单独把我们所做的Kalman滤波拿出来,如果做GNSS定位输出和点云定位的时候,我们会发现GNSS定位非常快,只要有原始消息就可以快速解算,但是点云定位的时间比较长,需要几十毫秒甚至上百毫秒,会出问题。也就是我们先收到的消息解算时间很长,才会有结果, 会造成量测更新的乱序 。我们解决这个问题的思路是用了 两个滤波器 ,一个滤波器是Filter1,主要是做 时间更新 ,实时的对外提供服务;量测更新是Filter2,我们会把Filter1的状态拷贝过来做 量测更新还会补齐最新时刻,用的是时间更新的方式 ,最后用Filter2代替Filter1,这样就解决了时间戳乱序的问题。


Robust and Precise Vehicle Localization based on Multi-sensor Fusion in Diverse City Scenes

Baidu Apollo MSF 定位论文笔记

Robust and Precise Vehicle Localization based on Multi-sensor Fusion in Diverse City Scenes

high localization accuracy and resilience(意思是能够快速恢复,有韧性、弹性)

centimeter-level (平均 10cm 误差)

GNSS Lidar IMU 融合

对于 Lidar,使用反射值(intensity)和高度(altitude)线索。

An error-state Kalman filter is applied to fuse the localization measurements from different sources with novel uncertainty estimation.


单点 GNSS 误差会达到 10 米,难以提供精确定位。

The carrier-phase based differential GNSS technique, known as Real Time Kinematic (RTK), can provide centimeter positioning accuracy.


LiDAR works well when the environment is full of 3D or texture features, while RTK performs excellently in open space .

An inertial measurement unit (IMU), including the gyroscopes and the accelerometers, continuously calculate the position, orientation, and velocity via the technology that is commonly referred to the dead reckoning. But it suffers badly from integration drift.

Lidar Map Generation

obtain a grid-cell representation of the environment. Each cell stores the statistics of laser reflection intensity and altitude.

use single Gaussian distribution to model the environment but involve both the intensity and the altitude.

combining both the intensity and the altitude measurements in the cost function through an adaptive weighting method can significantly improve the localization accuracy and robustness.

Lidar based localization

(x, y, a, h), a: altitude from HDMap; h: heading(yaw)

A. Heading Angle Estimation

project the online point cloud onto the ground plane, and an intensity image is generate, but the pixels filled with the intensity values in the image are thinly dispersed due to the sparsity of the online point cloud.

During the heading angle h estimation step, Lucas-Kanade algorithm is applied, which is a technique that uses the image gradient to search for the best match between two images. use the forwards additive algorithm.

Although the Lucas-Kanade algorithm can produce the horizontal translation estimation, we found that it is not accurate and robust enough in practice.

B. Horizontal Localization

Histogram filter is one of nonparametric approaches. It approximates the posteriors by decomposing the state space into finitely many regions, and representing the cumulative posterior for each region by a single probability value.

关于直方图滤波,最大化后验概率,通过取负对数技巧,可以转为求最小 SSD。

公式 (6) 里对于反射值的 SSD_{r} ,可以看成用两个标准差进行加权。The impact of the environment change is implicitly diminished by the variance term.

GNSS based localization


Sensor Fusion

an error-state Kalman filter is applied to fuse the localization measurements(Lidar, RTK) with IMU.

The fusion framework can optimally combine the orientation rate and accelerometer information from IMU, for improved accuracy. IMU is sufficiently accurate to provide robust state estimates between LiDAR and RTK measurements.

这里涉及到一系列 IMU 相关的方程。

A. SINS Kinematics Equation and Error Equation

A Strap-down Inertial Navigation System (SINS) estimates the position, velocity and attitude by integrating the IMU data.

B. Filter State Equation

Because the SINS error grows over time, to get a precise PVA, we use an error-state Kalman filter to estimate the error of the SINS and use the estimated error-state to correct the SINS.

C. Filter Measurement Update Equation

The measurement update comprises the LiDAR and GNSS parts.

D. Delay Handling

Due to the transmission and computation delay, the measurement delay and disorder must be taken into consideration.

用两个 kf,kf1 只用来做 IMU 的预测和校正,kf2 用来处理观测到达时间和实际观测时间乱序的情况。

Experimental result

数据集构建:开放场景用 NovAtel Inertial Explorer 等后处理提升精度;复杂场景,综合使用 NovAtel IE post-processing, LiDAR SLAM, loop closure, and the global pose-graph optimization

两种 modes:

3-systems 精度最高,2-systems 稍微差一点,定位误差 0.3m 内能达到 99%

平均定位误差 5~10cm

Lidar: 10Hz
SINS: 200Hz

Single CPU core 版本实现里,通过用更小的 histogram filter size 和对图像数据降采样来加速 yaw 估计。

Conclusion and future work

未来工作考虑更低成本的传感器(如 low-cost, low-end MEMS IMU)。