1.视频网站:mooc慕课https://mooc.study.163.com/university/deeplearning_ai#/c
2.详细笔记网站(中文):http://www.ai-start.com/dl2017/
3.github课件+作业+答案:https://github.com/stormstone/deeplearning.ai
3.10 RPN网络 区域生成网络Region proposals Network(Optional)
如果你们阅读一下对象检测的文献,可能会看到一组概念,所谓的候选区域region proposals,这在计算机视觉领域是非常有影响力的概念。
我把本节课定为可选课程是因为我用到候选区域这一系列算法的频率没有那么高,但当然了,这些工作是很有影响力的,你们在工作中也可能会碰到,我们来看看。
你们还记得滑动窗法吧,你使用训练过的分类器,在这些窗口中全部运行一遍,然后运行一个检测器,看看里面是否有车辆,行人和摩托车。现在你也可以运行一下卷积算法,这个算法的其中一个缺点是,它在显然没有任何对象的区域浪费时间,对吧。
如上图,这里这个矩形区域基本是空的,显然没有什么需要分类的东西。
所以Ross Girshick,Jeff Donahue,Trevor Darrell,Jitendra Malik,在本节课中引用到的论文中提出一种叫做R-CNN的算法,意思是带区域的卷积网络,或者说带区域的CNN。这个算法尝试选出一些区域,在这些区域上运行卷积网络分类器是有意义的,所以这里不再针对每个滑动窗运行检测算法,而是只选择一些窗口,在少数窗口上运行卷积网络分类器。
选出候选区域的方法是运行图像分割算法,分割的结果是上图右边的图像,为了找出可能存在对象的区域。
比如说,分割算法在上图得到一个色块,所以你可能会选择这样的边界框