机器学习实战
文章平均质量分 69
smile__su
这个作者很懒,什么都没留下…
展开
-
《机器学习实战》第一章读书笔记
看过第一章之后,个人认为这里有三个比较重要的问题一、机器学习的主要任务二、如何选择合适的算法三、开发机器学习应用的步骤一、机器学习的主要任务1.分类在分类问题中,机器学习主要任务是将实例数据划分到合适的分类中2.回归在回归问题中,它主要通过给定数据点拟合曲线来预测数值型数据。分类和回归属于监督学习,之所以是监督学习是因为这类算法必须知道预测什么,即目标变量的分类信息。与监督学习相对应的是无监督学习...原创 2018-03-30 20:15:04 · 242 阅读 · 0 评论 -
《机器学习实战》第二章——K-近邻算法
1.K-近邻算法(kNN)1.1K-近邻算法概述简单的说,K-近邻算法采用测量不同特征值之间的距离方法进行分类优点:精度高、对异常值不敏感、无数据输入假定缺点:计算复杂度高、空间复杂度高适用数据范围:数值型和标称型1.2KNN算法原理 存在一个样本训练数据集合,并且每个样本数据都存在标签,即我们知道样本集中每一位数据和所属分类的对应关系。输入没有新标签的数据集后,将新数据的每个特征与数据集样本中的...原创 2018-04-01 21:10:59 · 298 阅读 · 0 评论 -
机器学习问题中过拟合出现的原因及解决方案
如果一味的追求模型的预测能力,所选的模型复杂度就会过高,这种现象称为过拟合。模型表现出来的就是训练模型时误差很小,但在测试的时候误差很大。一、产生的原因:1.样本数据问题样本数据太少样本抽样不符合业务场景样本中的噪音数据影响2.模型问题模型复杂度高,参数太多决策树模型没有剪纸模型训练过程中权重迭代次数太多,拟合了数据中的噪声数据二、解决方案1.样本数据方面...原创 2018-08-11 14:42:45 · 2431 阅读 · 0 评论 -
逻辑回归原理
看了很多遍逻辑回归的原理,但是发现自己还是不能完整的讲清楚它的原理,所以在这里写一篇博客来理清楚自己的思路。水平有限,如有错误还请指正。逻辑回归原理逻辑回归是利用回归类似的方法来解决分类问题。假设有一个二分类问题,输出y{0,1},而线性模型(下文将展示这个模型)的的预测值z是实数值,我们希望找到一个阶跃函数将实数z映射为{0,1},这样我们就能很好的处理分类问题了。那么逻辑回归中是使用什...原创 2018-08-12 03:07:27 · 6805 阅读 · 0 评论