数据驱动的图像分类方式:K最近邻与线性分类器

最邻近规则分类器KNN

简单描述:首先在n个数据集中指定m个分类,这是学习过程。在使用中,对于新输入的数据,计算其k范围内,或者最邻近的k个点,根据多数表决规则,决定其属于m分类中的哪个分类。

关于距离:

可以使用马哈顿距离、欧式距离等。

关于多数表决原则:

等价于经验风险最小化。

关于具体实现:

kd树。

 

线性分类器

两张图片,一张猫的,一张狗的如何分类?

 

如图所示,为n*m的图片,可以拉伸为n*m的一维数组,构建一个有n*m的神经元的网络,根据如下公式。

f(xi,w,b)=w*xi+b,其中xi和b为权值。

得到一个实数输出,根据这个实数输出得到图片的分类。

可以看到,由于xi值得不同,线性分类器得到不同的输出,这时候根据是否大于零就可进行分类了。

可以看到分类器没有利用像素之间的空间关系,所以实际上分类效果很差。

在实际使用中,需要手动对图片进行标记,是一种最简单的有监督学习,而后根据人工标记的正确分类调整wi,从而让输入的分类和实际分类是一样的。

 

关于线性分类器的训练。

下一节学习。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
基于sklearn自带的breast_cancer数据集,我们可以构建四个分类模型:k最近邻分类(K-Nearest Neighbors,KNC)、高斯朴素贝叶斯(Gaussian Naive Bayes)、支持向量机(Support Vector Machine,SVM)和决策树(Decision Tree)。 其中,k最近邻分类(K-Nearest Neighbors,KNC)是一种基于实例的学习算法,通过计算新样本与已知样本之间的距离,然后将新样本分配给距离其最近的k个已知样本的多数类别来进行分类。在使用KNC进行分类时,可以通过调整k的取值来改变模型的性能。 高斯朴素贝叶斯(Gaussian Naive Bayes)是一种基于贝叶斯定理的概率分类模型。它假设所有特征之间相互独立,并且每个特征的分布都服从高斯分布。在构建高斯朴素贝叶斯模型时,我们可以使用breast_cancer数据集的特征值来计算每个分类的概率,并选择具有最高概率的分类作为预测结果。 上述提到的两种分类算法都是基于实例或概率的方法,而支持向量机(Support Vector Machine,SVM)和决策树(Decision Tree)则是基于规则的分类算法。 支持向量机(Support Vector Machine,SVM)是一种经典的机器学习分类算法。它通过构造超平面来将数据分割成不同的类别,同时尽量将超平面与最近的数据点之间的间隔最大化。在使用SVM进行分类时,我们可以调整惩罚参数和核函数等参数来改变模型的性能。 决策树(Decision Tree)是一种通过构建树形结构来进行分类的方法。在构建决策树模型时,我们可以根据不同特征的信息增益或基尼指数等指标来选择最优的划分特征,并生成决策树。在预测时,通过遍历决策树的节点来得到最终的分类结果。 综上所述,基于sklearn自带的breast_cancer数据集,我们可以构建四个分类模型:k最近邻分类(KNC)、高斯朴素贝叶斯(Gaussian Naive Bayes)、支持向量机(SVM)和决策树(Decision Tree)。根据具体需求,我们可以选择适合的分类模型来进行预测和分析。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值