计算机视觉之训练分类器

最新推荐文章于 2022-12-06 16:43:51 发布

极致 for 简单

最新推荐文章于 2022-12-06 16:43:51 发布

阅读量465

点赞数

分类专栏：计算机视觉计算机视觉文章标签：训练分类器方法

本文链接：https://blog.csdn.net/m0_37937932/article/details/86013398

版权

计算机视觉同时被 2 个专栏收录

14 篇文章 0 订阅

订阅专栏

计算机视觉

13 篇文章 1 订阅

订阅专栏

训练策略：
无参模型:KNN（lazy，没有训练过程，可直接用于分类，在knn和k-means上有点迷，k-means是将所有的样本聚类，构建词袋、图像分割、拟合多条直线的时候，用了k-means）
生成模型：naive bayes
判别模型：线性模型和SVM

KNN（k的选择和距离公式选择很重要）：
将测试样本与训练集中的样本做距离运算，找到最近的k个样本，记录最多的标注结果。
实际的问题来了，如果把测试样本与所有训练集样本做距离运算，计算量太大了，能不能找到一种方法减少计算量？

解决方案1：Locality Sensitive Hashing
通过构建hash table 可以使得原本距离很近的样本分在同一个bucket，这样在找k个相近的样本时，就只要考虑同一个bucket中的样本，找到k个最近的样本后，记录k个样本类出现的个数，利用投票机制，确定测试样本所属类别。
随机选择多个投影向量，与数据向量做点积得到部分索引值，所有索引号相同的数据项在一个bucket中。由于所选的投影向量是随机的，可能实际相邻的样本hash之后不在同一个bucket中，没有关系，重新选择投影向量相邻数据项就有可能在同一个bucket中。
在这里插入图片描述
解决方案2：K-D 树

朴素贝叶斯：（有了训练集，那么p(y=1) 、 p（x|y=1）的值可根据训练集求出，写到这里对在图像分割利用贝叶斯、MRF理论有了更深的认识，由于没有训练样本，所以利用了吉布斯引入团的概念，求各个像素可能的类别的概率）
p(y=1|x)=p(x|y=1)p(y=1)/p(x)
假设特征无关，根据训练集中相应特征出现的概率乘积来训练分类器。

linear 分类器、SVM思想找到一个判别平面来分离不同类型的数据。

多分类问题：
one vs one：训练集中每两个类生成一个分类器
one vs all ：训练集中以一个类为正样本，其余所有样本作为负样本

分类器性能指标：
ROC和AOC

极致 for 简单

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
计算机视觉之训练分类器

训练策略：无参模型:KNN生成模型：naive bayes判别模型：线性模型和SVMKNN（k的选择和距离公式选择很重要）：将测试样本与训练集中的样本做距离运算，找到最近的k个样本，记录最多的标注结果。实际的问题来了，如果把测试样本与所有训练集样本做距离运算，计算量太大了，能不能找到一种方法减少计算量？解决方案1：Locality Sensitive Hashing通过构建hash...
复制链接

扫一扫

专栏目录