kindle电子书

资源下载,尽在我的书库!
首页 > kindle电子书库 > 工业|计算机|互联网 > 电子、计算机、网络

视觉SLAM十四讲:从理论到实践

  • 作者:[中] 高翔
  • 体积:41.92 MB
  • 语言:中文
  • 日期:2018-06-16
  • 推荐:

简介:《视觉SLAM十四讲:从理论到实践》系统介绍了视觉SLAM(同时定位与地图构建)所需的基本知识与核心算法,既包括数学理论基础,如三维空间的刚体运动、非线性优化,又包括计算机视觉的算法实现,例如多视图几何、回环检测等。此外,还提供了大量的实例代码供读者学习研究,从而更深入地掌握这些内容。

电子书详细介绍

 《视觉SLAM十四讲:从理论到实践》系统介绍了视觉SLAM(同时定位与地图构建)所需的基本知识与核心算法,既包括数学理论基础,如三维空间的刚体运动、非线性优化,又包括计算机视觉的算法实现,例如多视图几何、回环检测等。此外,还提供了大量的实例代码供读者学习研究,从而更深入地掌握这些内容。 
《视觉SLAM十四讲:从理论到实践》可以作为对SLAM感兴趣的研究人员的入门自学材料,也可以作为SLAM相关的高校本科生或研究生课程教材使用。 

编辑推荐

适读人群:本书适合对SLAM感兴趣的读者阅读,也适合有志于从事计算机视觉、机器人研究等领域的广大学生阅读,可作为SLAM技术的入门教材。
SLAM技术是全自动无人驾驶、无人机、机器人等人工智能产品的核心技术之一。
作者是SLAM领域非常杰出的青年专家。
书中不仅有深入浅出的讲解,同时注重理论和实践结合,大大降低了国内学生和相关从业者的进入门槛。

作者简介

高翔,2008年就读清华大学自动化系,2012年免试进入清华大学自动化系攻读博士学位。研究课题为视觉SLAM,兴趣包括计算机视觉与机器学习。曾撰写过与SLAM相关的论文和技术博客。
张涛,清华大学自动化系教授、党委书记、副系主任。1995年9月至1999年9月在清华大学自动化系检测技术与自动化装置专业学习,获博士学位。1999年10月至2002年9月在日本国立佐贺大学大学院工学系研究科系统控制专业学习,获博士学位。研究课题包括机器人、航空航天、计算机视觉等。
刘毅,华中科技大学图像与人工智能研究所在读博士,本科毕业于武汉理工大学数学系。读博期间专注于图像处理、三维重建、视觉SLAM,以及传感器融合研究和应用,读博期间先后于深圳市大疆创新公司,英特尔中国研究院等单位实习。
颜沁睿,比利时荷语鲁汶大学人工智能硕士,电子工程学士(GroupT)。电子科技大学信息显示与光电技术学士。长期致力于研究人工智能技术在机器人领域的应用,包括计算机视觉、机器学习和SLAM。现担任地平线机器人公司智能驾驶部算法工程师。

 

目录

第1讲预备知识1
1.1本书讲什么1
1.2如何使用本书3
1.2.1组织方式3
1.2.2代码5
1.2.3面向的读者6
1.3风格约定6
1.4致谢和声明7
第2讲初识SLAM9
2.1引子:小萝卜的例子11
2.2经典视觉SLAM框架17
2.2.1视觉里程计17
2.2.2后端优化19
2.2.3回环检测20
2.2.4建图21
2.3SLAM问题的数学表述22
2.4实践:编程基础25
2.4.1安装Linux操作系统25
2.4.2HelloSLAM27
2.4.3使用cmake28
2.4.4使用库30
2.4.5使用IDE32
第3讲三维空间刚体运动37
3.1旋转矩阵39
3.1.1点和向量,坐标系39
3.1.2坐标系间的欧氏变换40
3.1.3变换矩阵与齐次坐标42
3.2实践:Eigen44
3.3旋转向量和欧拉角48
3.3.1旋转向量48
3.3.2欧拉角50
3.4四元数51
3.4.1四元数的定义51
3.4.2四元数的运算53
3.4.3用四元数表示旋转55
3.4.4四元数到旋转矩阵的转换55
3.5相似、仿射、射影变换56
3.6实践:Eigen几何模块57
3.7可视化演示60
第4讲李群与李代数62
4.1李群与李代数基础64
4.1.1群64
4.1.2李代数的引出65
4.1.3李代数的定义67
4.1.4李代数so(3)67
4.1.5李代数se(3)68
4.2指数与对数映射69
4.2.1SO(3)上的指数映射69
4.2.2SE(3)上的指数映射.70
4.3李代数求导与扰动模型72
4.3.1BCH公式与近似形式72
4.3.2SO(3)李代数上的求导73
4.3.3李代数求导74
4.3.4扰动模型(左乘)75
4.3.5SE(3)上的李代数求导76
4.4实践:Sophus76
4.5相似变换群与李代数.79
4.6小结81
第5讲相机与图像82
5.1相机模型84
5.1.1针孔相机模型84
5.1.2畸变87
5.1.3双目相机模型90
5.1.4RGB—D相机模型92
5.2图像93
5.3实践:图像的存取与访问95
5.3.1安装OpenCV95
5.3.2操作OpenCV图像96
5.4实践:拼接点云99
第6讲非线性优化104
6.1状态估计问题106
6.1.1最大后验与最大似然106
6.1.2最小二乘的引出108
6.2非线性最小二乘109
6.2.1一阶和二阶梯度法110
6.2.2高斯牛顿法111
6.2.3列文伯格—马夸尔特方法113
6.2.4小结114
6.3实践:Ceres115
6.3.1Ceres简介116
6.3.2安装Ceres116
6.3.3使用Ceres拟合曲线117
6.4实践:g2o121
6.4.1图优化理论简介121
6.4.2g2o的编译与安装122
6.4.3使用g2o拟合曲线123
6.5小结128
第7讲视觉里程计1130
7.1特征点法132
7.1.1特征点132
7.1.2ORB特征134
7.1.3特征匹配137
7.2实践:特征提取和匹配138
7.32D?2D:对极几何141
7.3.1对极约束141
7.3.2本质矩阵143
7.3.3单应矩阵146
7.4实践:对极约束求解相机运动148
7.5三角测量153
7.6实践:三角测量154
7.6.1三角测量代码154
7.6.2讨论156
7.73D?2D:PnP157
7.7.1直接线性变换158
7.7.2P3P159
7.7.3BundleAdjustment161
7.8实践:求解PnP165
7.8.1使用EPnP求解位姿165
7.8.2使用BA优化166
7.93D?3D:ICP172
7.9.1SVD方法173
7.9.2非线性优化方法175
7.10实践:求解ICP176
7.10.1SVD方法176
7.10.2非线性优化方法178
7.11小结180
第8讲视觉里程计2182
8.1直接法的引出184
8.2光流(OpticalFlow)185
8.3实践:LK光流187
8.3.1使用TUM公开数据集187
8.3.2使用LK光流188
8.4直接法(DirectMethod)192
8.4.1直接法的推导192
8.4.2直接法的讨论195
8.5实践:RGB—D的直接法196
8.5.1稀疏直接法196
8.5.2定义直接法的边197
8.5.3使用直接法估计相机运动199
8.5.4半稠密直接法200
8.5.5直接法的讨论202
8.5.6直接法优缺点总结203
第9讲实践:设计前端205
9.1搭建VO框架206
9.1.1确定程序框架207
9.1.2确定基本数据结构208
9.1.3Camera类210
9.1.4Frame类212
9.1.5MapPoint类213
9.1.6Map类213
9.1.7Config类214
9.2基本的VO:特征提取和匹配216
9.2.1两两帧的视觉里程计216
9.2.2讨论224
9.3改进:优化PnP的结果224
9.4改进:局部地图227
9.5小结233
第10讲后端1235
10.1概述237
10.1.1状态估计的概率解释237
10.1.2线性系统和KF239
10.1.3非线性系统和EKF242
10.1.4EKF的讨论243
10.2BA与图优化245
10.2.1投影模型和BA代价函数245
10.2.2BA的求解247
10.2.3稀疏性和边缘化248
10.2.4鲁棒核函数255
10.2.5小结256
10.3实践:g2o257
10.3.1BA数据集257
10.3.2g2o求解BA258
10.3.3求解262
10.4实践:Ceres264
10.4.1Ceres求解BA265
10.4.2求解267
10.5小结269
第11讲后端2270
11.1位姿图(PoseGraph)271
11.1.1PoseGraph的意义271
11.1.2PoseGraph的优化272
11.2实践:位姿图优化274
11.2.1g2o原生位姿图274
11.2.2李代数上的位姿图优化278
11.2.3小结284
11.3因子图优化初步285
11.3.1贝叶斯网络285
11.3.2因子图286
11.3.3增量特性288
11.4实践:gtsam289
11.4.1安装gtsam4.0289
11.4.2位姿图优化290
第12讲回环检测297
12.1回环检测概述299
12.1.1回环检测的意义299
12.1.2方法300
12.1.3准确率和召回率301
12.2词袋模型303
12.3字典305
12.3.1字典的结构305
12.3.2实践:创建字典306
12.4相似度计算309
12.4.1理论部分309
12.4.2实践:相似度的计算310
12.5实验分析与评述314
12.5.1增加字典规模314
12.5.2相似性评分的处理316
12.5.3关键帧的处理316
12.5.4检测之后的验证317
12.5.5与机器学习的关系317
第13讲建图319
13.1概述320
13.2单目稠密重建322
13.2.1立体视觉322
13.2.2极线搜索与块匹配323
13.2.3高斯分布的深度滤波器325
13.3实践:单目稠密重建328
13.4实验分析与讨论339
13.4.1像素梯度的问题339
13.4.2逆深度340
13.4.3图像间的变换341
13.4.4并行化:效率的问题342
13.4.5其他的改进343
13.5RGB—D稠密建图343
13.5.1实践:点云地图344
13.5.2八叉树地图347
13.5.3实践:八叉树地图350
13.6*TSDF地图和Fusion系列352
13.7小结356
第14讲SLAM:现在与未来357
14.1当前的开源方案358
14.1.1MonoSLAM358
14.1.2PTAM359
14.1.3ORB—SLAM361
14.1.4LSD—SLAM363
14.1.5SVO364
14.1.6RTAB—MAP366
14.1.7其他367
14.2未来的SLAM话题367
14.2.1视觉+惯性导航SLAM367
14.2.2语义SLAM369
14.2.3SLAM的未来370
附录A高斯分布的性质371
A.1高斯分布371
A.2高斯分布的运算371
A.2.1线性运算371
A.2.2乘积372
A.2.3复合运算372
A.3复合的例子372
附录BROS入门374
B.1ROS是什么374
B.2ROS的特点375
B.3如何快速上手ROS375
参考文献377

我来说两句

本书评论

共有 0 条评论
图书分类
我的书库手机端
帮助中心
会员登录 ×
新用户注册 ×