《机器学习实战》笔记
文章平均质量分 91
机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中获取有价值的信息或模式,成为各行业求生存、谋发展的决定性手段,这使得这一过去为分析师和数学家所专属的领域越来越为人们所瞩目。
Herbert_Zero
这个作者很懒,什么都没留下…
展开
-
《机器学习实战》学习笔记:利用Adaboost元算法提高分类性能
Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器,即弱分类器,然后把这些弱分类器集合起来,构造一个更强的最终分类器,比起弱分类器,这个“强”分类器的错误率会低很多。原创 2015-10-08 22:30:23 · 4189 阅读 · 2 评论 -
《机器学习实战》学习笔记:支持向量机
支持向量机,就是通过最大化支持向量到分类超平面之间的分类间隔。分类超平面就是我们想要得到的决策曲面;支持向量就是离分类超平面最近的点,而间隔即为支持向量到分类超平面的距离。原创 2015-10-01 23:59:09 · 3825 阅读 · 0 评论 -
《机器学习实战》学习笔记:Logistic回归&预测疝气病证的死亡率
生活中,人们经常会遇到各种最优化问题,比如如何在最短时间从一个地点到另外一个地点?如何在投入最少的资金而却能得到最高的受益?如何设计一款芯片使其功耗最低而性能最好?这一节就要学习一种最优化算法——Logistic回归...原创 2015-09-20 19:13:33 · 5812 阅读 · 0 评论 -
《机器学习实战》学习笔记:基于朴素贝叶斯的垃圾邮件过滤
概率是许多机器学习算法的基础,在前面生成决策树的过程中使用了一小部分关于概率的知识,即统计特征在数据集中取某个特定值的次数,然后除以数据集的实例总数,得到特征取该值的概率。之前的基础实验中简单实现了朴素贝叶斯分类器,并正确执行了文本分类,这一节将贝叶斯运用到实际场景,垃圾邮件过滤这一实际应用。原创 2015-09-15 09:59:28 · 14896 阅读 · 3 评论 -
《机器学习实战》学习笔记:基于朴素贝叶斯的分类方法
概率是许多机器学习算法的基础,在前面生成决策树的过程中使用了一小部分关于概率的知识,即统计特征在数据集中取某个特定值的次数,然后除以数据集的实例总数,得到特征取该值的概率。原创 2015-09-12 00:02:32 · 8496 阅读 · 9 评论 -
《机器学习实战》学习笔记:绘制树形图&使用决策树预测隐形眼镜类型
上一节实现了决策树,但只是使用包含树结构信息的嵌套字典来实现,其表示形式较难理解,显然,绘制直观的二叉树图是十分必要的。Python没有提供自带的绘制树工具,需要自己编写函数,结合Matplotlib库创建自己的树形图。第二部分,使用决策树预测患者佩戴隐形眼镜的类型。原创 2015-09-06 17:04:34 · 5490 阅读 · 2 评论 -
《机器学习实战》学习笔记:决策树的实现
决策树是个极其易懂的算法,也是最常用的数据挖掘算法,决策树允许机器根据数据集创造规则,其实这就是机器学习的过程。专家系统中经常会使用到决策树及其变种,而且决策树给出的结果往往可以匹敌在当前领域具有几十年工作经验的专家。优点:决策树的计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据;缺点:可能会产生过度匹配的问题;适用数据类型:数值型和标称型。原创 2015-09-02 23:41:54 · 2687 阅读 · 0 评论 -
《机器学习实战》学习笔记:k-近邻算法的两个应用场景
之前学习了k-近邻算法的实现后,参考《机器学习实战》中的例子进行了k-近邻算法的测验,主要测试了针对约会网站和手写识别系统的数据分类,这两个测试使用的是《机器学习实战》提供的数据集。原创 2015-09-01 23:05:27 · 14293 阅读 · 6 评论 -
《机器学习实战》学习笔记:k-近邻算法实现
机器学习:k-近邻(kNN)算法的基本原理与Python实现原创 2015-08-30 00:10:35 · 4377 阅读 · 5 评论