图像分类:
输入图片,通过矩阵计算变换,得到1*n的一维向量,每个元素表示归属某一类的概率
目标检测:
滑动窗口 = 窗口滑动,同时对窗口内的内容进行图像分割
可以看到这个方法的计算量特别大。
同时,可以看出目标检测的关键点是怎么获得窗口。通常是通过region proposal来获得窗口。最容易想到的方法就是暴力枚举可能的窗口,这显然是不可行的。现在region proposal常用的方法是selective search
图像分割:
输
图像分类:
输入图片,通过矩阵计算变换,得到1*n的一维向量,每个元素表示归属某一类的概率
目标检测:
滑动窗口 = 窗口滑动,同时对窗口内的内容进行图像分割
可以看到这个方法的计算量特别大。
同时,可以看出目标检测的关键点是怎么获得窗口。通常是通过region proposal来获得窗口。最容易想到的方法就是暴力枚举可能的窗口,这显然是不可行的。现在region proposal常用的方法是selective search
图像分割:
输