CVPR-2020笔记 | 文末送书


目录

(.)中的数字表示数量。

  • 教程(4)

  • 获奖论文摘要(3)

  • 可控图像合成(2)

  • 不平衡样本处理(2)

  • 多任务学习(1)

  • 表示学习(2)

  • 自我监督学习(2)

  • 半监督学习(2)

  • 弱监督学习(用于语义分割)(3)

  • 目标检测(2)

  • 知识提炼(三)

  • 数据扩充(4)

  • 优化(3)

  • 评价与概括(3)

  • 不确定度估计(3)


[Tutorial | Sun.] How to write a good paper? — Bill Freeman (MIT, Google)

视频:(https://www.youtube.com/watch?v=W1zPtTt43LI&t=467s)

题目:如何写一篇好论文

  • 为什么它很重要?一篇有创意的,原创的,非常强的论文会比那些还可以的、糟糕的论文更影响你的职业生涯:让你的努力变得有价值

  • 陈述你的问题,让读者知道你解决的问题是什么;其他的解决方案是什么,为什么其它方案不行;解释你自己的解决方案以及为什么它更好;用简单的例子传达主要思想;在实验中进行合理的比较;最后总结一下你的成果会带来什么应用或贡献,或者它如何改变我们处理问题的方式;还有以“未来的工作”结束是个坏主意(即,我们想做,但未能在截止日期前及时做完)。

  • 使你的论文易于阅读(在匆忙中仍能学到要点);写出简洁的句子(即,不要冗长!);数字和标题应该是独立的。

  • 积极的语调-要和蔼可亲不要过度推销,隐藏缺点和贬低他人的工作;诚实地指出局限性

  • 一个好标题很重要。

  • 会议期刊拒绝论文的理由:没有兑现论文的承诺;遗漏重要参考文献;太多或令人难以置信的结果;写得不好;陈述不正确;写得很好但却枯燥乏味的论文;虽然新颖精彩容易指出缺点的论文。

  • 好的写作就是重新写作。所以要早点开始写论文。


[Tutorial | Sun.] All You Need to Know About Self-Driving by Uber ATG

链接:(http://www.allaboutselfdriving.com/)

题目:由Uber ATG提供你想了解的关于自动驾驶的信息

本教程涵盖了自动驾驶管道中的主要技术组件,包括不同传感器模式的数据预处理、三维物体检测的感知、长期预测、行驶轨迹规划、转向和加速等控制以及车辆与车辆之间的通信。这里我只记录了传感器的形态和感知。

传感器模态和感知(3D物体检测)

  • 激光雷达(3D):

    • 点云表示,如3D体素(3D卷积有效的特征提取;昂贵的计算和内存消耗;CVPR'18的VoxelNet):https://arxiv.org/abs/1711.06396

    • 距离视图(保留全范围信息;由于3D信息丢失而导致邻域不真实;CVPR'19的LaserNet):https://arxiv.org/abs/1903.08701

    • 鸟瞰图(2D卷积的有效特征提取;内存消耗昂贵;CVPR'19的PointPillars):https://arxiv.org/abs/1812.04244

    • 3D点集(精确定位;昂贵的计算和内存消耗;多尺度特征的次优关键点;CVPR'19的PointRCNN):https://arxiv.org/abs/1812.04244

    • 这些表示大多是稀疏的,可以通过使用稀疏卷积网络或稀疏块网络(CVPR'18)来加速。:https://arxiv.org/abs/1801.02108

  • 摄像机(2D):比激光雷达便宜。将2D输入/特征/输出转换为3D,然后使用现有的探测器。

    • 转换为3D输出:2D关键点预测+3D盒子模板匹配=3D盒子输出(性能不理想);

    • 转换3D输入:2D图像+深度估计=“伪激光雷达”(SoTA基于图像的3D感知;由于需要深度模型而产生的额外计算成本;ICLR'20的伪激光雷达++CVPR'20的E2E伪激光雷达):https://arxiv.org/abs/1906.06310与https://arxiv.org/abs/2004.03080

    • 转换到3D特征:根据相机内部特性将2D特征映射到3D(鸟眼)特征(无需深度估计;深度模糊导致的3D特征误差;BMVC'19的正交特征转换):https://arxiv.org/abs/1811.08188

  • 传感器融合-激光雷达+摄像机:融合可以在输入/特征/输出中以级联或并行的方式发生。

  • 传感器融合-雷达(几何结构)+摄像机(性能无法与基于激光雷达的系统相匹配);雷达(作为速度)+激光雷达。请参阅arXiv'20的“Exploiting Radar for Robust Perception of Dynamic Objects”。

  • 高清地图:语义信息。主要用于运动规划系统。几何方面,请参见CoRL'18的HDNet(http://proceedings.mlr.press/v87/yang18b/yang18b.pdf?utm_source);作为rasters,请参阅WACV'20的Uncertainty-aware Short-term Motion Prediction of Traffic Actors for Autonomous Driving(https://arxiv.org/abs/1808.05819);作为车道图(更直观但更复杂的模型设计),请参见CVPR'20的VectorNet(https://arxiv.org/abs/2005.04259)。


[Workshop | Mon.] Scalability in Autonomous Driving

题目:自动驾驶的可扩展性

链接:https://sites.google.com/view/cvpr20-scalability

  • 第一名的解决方案报告令人印象深刻,他们花了2个月才获得第一名。他们的系统中的许多组件似乎都得到了集中的优化,而且还应用了一些新的技巧。

[Keynote]Raquel Urtasun,Uber ATG的 Scalable Simulation for Self Driving
  • 仿真可用于训练和安全评估。完整的模拟包括状态(参与者行为)、几何体(参与者和环境三维模型)和观察(自动驾驶汽车感知的激光雷达和摄像机表示)。

  • 状态:ActorSim(http://makro.ink/actorsim/) (现实性和多样性)。

  • 几何状态+激光雷达传感模拟:CARLA(https://carla.org/)(设计3D参与者资产耗时;环境多样性有限;不切实际;CoRL'17);Blensor(ht

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值