![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 79
疯狂奔跑的少年
砥砺前行,不断进取
展开
-
机器学习(西瓜书)之二项检验的理解
比较检验前言内容引出二项检验前言 二项检验在周志华老师的西瓜书中并没有做太多解释,自己也是网上搜索了相关的资料和其他人的看法,并结合了自己的一些理解写下博客记录一下。内容引出 我们在对学习器的性能进行评估比较的时候,有了评估方法和性能度量也不一定能很好判断学习器的优劣,通常是用统计假设检验,基于假设检验的结果我们可以推断出,若在测试集上观察到学习器A比B好,则A的泛化性能是否在统计意义上优于B,以及这个结论的把握有多大。这里,默认以错误率为性能度量,用ϵ\epsilonϵ表示,即泛化错误率。原创 2020-10-06 22:19:12 · 3853 阅读 · 6 评论 -
机器学习:python绘制P-R曲线与ROC曲线
Python绘制P-R曲线与ROC曲线查准率与查全率P-R曲线的绘制ROC曲线的绘制查准率与查全率 P-R曲线,就是查准率(precision)与查全率(recall)的曲线,以查准率作为纵轴,以查全率作为横轴,其中查准率也称为准确率,查全率称为召回率,所以在绘制图线之前,我们先对这些进行大概的介绍。 对于二分类问题,我们可以将样例根据其真实类别与学习器预测类别的组合划分为真正例(true positive),假正例(false positive),真反例(true negative),以及假反原创 2020-09-18 21:07:56 · 7560 阅读 · 3 评论 -
机器学习之Logistic回归解析及实例应用
参考博客:https://techlog.cn/article/list/10183274https://blog.csdn.net/u012762410/article/details/78912667前言:学习《机器学习实战》这本书到现在,这一章节算是数学理论较多的,也很高兴自己能通过搜索资料和学习他人博客推导出运算公式并了解代码含义,对自己而言也是一个小的突破,继续写下机器学习博客记录。Logistic回归回归:假设有一些数据点,我们用一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合原创 2020-08-29 14:27:03 · 2024 阅读 · 0 评论 -
机器学习之朴素贝叶斯详细介绍及实例应用
基于概率论的分类方法:朴素贝叶斯朴素贝叶斯算法:朴素贝叶斯算法是有监督的学习算法,同样是解决分类的问题,之所以称之为朴素,也就是因为整个其整个形式化过程只做最原始,最简单的假设。优点:在数据较少的情况下仍然有效,可以处理多类别的问题。缺点:对于输入数据的准备方式较为敏感。适用数据类型:标称型数据。朴素贝叶斯是贝叶斯决策理论的一部分,所以讲朴素贝叶斯之前有必要了解贝叶斯决策理论。贝叶斯决策理论:我们可以看一个数据集,它由两类数据组成,它们的数据分布图如图:我们现在用p1(x,y)表示数据点原创 2020-08-22 11:14:28 · 3311 阅读 · 0 评论 -
机器学习决策树的Sklearn的实现(隐形眼镜镜片决策树实现)
上一篇博客我对决策树做了介绍,当然那是自己编写的算法去实现决策树的构造和图的绘制,在sklearn库中sklearn.tree模块提供了决策树模型供我们使用,所以对它来个简单介绍。回顾:决策树是一种用于分类和回归的非参数监督学习方法。目的是创建一个模型,该模型通过学习从数据特征推断出的简单决策规则来预测目标变量的值。我们将用sklearn库中的模块对决策树进行构造。sklearn.tree.DecisionTreeClassifier决策树的构建函数class sklearn.tree.Decisi原创 2020-08-10 22:12:12 · 1508 阅读 · 1 评论 -
机器学习之决策树算法详解干货
讲在前面:上一篇我们讲述了《机器学习实战》的K-近邻算法,刚好最近学习了第三章的决策树,既然开了前一章的头,那么我久继续将这类博客写下去,对自己的知识也可以巩固提高,也希望可以对我这样的小白也有帮助。决策树是一种基本的分类和回归的方法。我们经常使用决策树处理分类问题,决策树也是最经常使用的数据挖掘算法。其实决策树的工作原理很简单,我们可以通过简单的图形来了解:上图我们用一个邮件的分类系统来大致讲述其工作原理,正方形代表的是判断模块,椭圆形代表的是终止模块,表示的是已经得出的结论,可以终止运行,从判断模原创 2020-08-08 16:48:40 · 843 阅读 · 2 评论 -
机器学习之k-近邻算法学习(KNN)
最近学习的《机器学习实战》,书中的代码思想介绍比较简单,网上搜索的博客也层出不穷,所以自己写个关于机器学习的博客,加深自己的学习印象,也可以让自己以后可以随时回顾。机器学习的主要任务就是对数据进行分析挖掘,提炼出有价值的信息,其中也包括了很多的算法,本篇博客介绍的也是其中之一的k-近邻算法。所以先对k-近邻算法做个介绍,他的工作原理就是存在一个样本数据集合,也称为训练样本集(大量已知的分类数据),并且样本集中每个数据都存在标签,即我们知道样本集中每一个数据与所属分类的对应关系。输入没有标签的新数据后,将新原创 2020-08-01 12:49:31 · 2807 阅读 · 5 评论