机器学习实战
盲人骑瞎马5555
努力搬砖~
间歇性发奋图强~
展开
-
《机器学习实战》训练营——AdaBoost算法
《李航统计学习方法》第8章 提升方法提升(boosting)方法是一种常用的统计学习方法,应用广泛且有效。在分类问题中,它通过改变训练样本的权重,学习多个分类器,并将这些分类器进行线性组合,提高分类的性能。8.1 提升方法AdaBoost算法在概率近似正确(probably approximately correct,PAC)学习的框架中,一个概念(一个类),如果存在一个多项式...原创 2018-11-06 10:02:44 · 176 阅读 · 0 评论 -
《机器学习实战》训练营——预测鲍鱼的年龄
原创 2018-11-05 15:13:19 · 2436 阅读 · 0 评论 -
《机器学习实战》训练营——使用Apriori算法发现毒蘑菇的相似特征
原创 2018-11-16 16:48:07 · 3924 阅读 · 1 评论 -
《机器学习实战》训练营——K-均值聚类对地理坐标聚簇
原创 2018-11-15 09:55:42 · 522 阅读 · 0 评论 -
《机器学习实战》训练营——从新闻网站点击流中挖掘
原创 2018-11-23 09:39:39 · 372 阅读 · 0 评论 -
《机器学习实战》训练营——餐馆菜肴推荐引擎和SVD图像压缩
原创 2018-12-04 12:55:47 · 661 阅读 · 0 评论 -
《机器学习实战》训练营——利用PCA对半导体制造数据降维
原创 2018-12-04 12:58:46 · 1176 阅读 · 0 评论 -
机器学习综述(一) ---- 贝叶斯网络
该系列日志仅记录在做machine learning review的group meeting slides中的各种疑惑及寻求到的答案。1.什么是贝叶斯网络?贝叶斯网络,又称信念网络或是有向无环图模型,是一种概念图模型,借由有向无环图中得知一组随机变量及其n组条件概率分布的性质。2.贝叶斯网络的学习目标是什么?举例而言,贝叶斯网络可用来表示疾病和其相关症状间的概率关系;倘若已知某种...原创 2019-10-10 12:43:44 · 926 阅读 · 0 评论 -
机器学习综述(二) ---- 主成分分析,因子分析,独立成分分析,多维缩放
1. 主成分分析是什么?主成分分析是一种特征降维的方法。学习理论中,特征是要剔除与标签无关的特征。比如“汽车的颜色”与“汽车的速度”无关;主成分分析要处理与标签有关、但是存在噪声或冗余的特征。比如在一个汽车样本中,“千米/小时”与“英里/小时”中有一个冗余了。主成分分析的方法比较直接,只要计算特征向量就可以降维了。2.因子分析是什么?因子分析是一种数据简化技术,是一种数据的...原创 2019-10-10 20:07:52 · 558 阅读 · 0 评论 -
《机器学习实战》训练营——在一个难数据集上应用AdaBoost
原创 2018-10-30 20:31:11 · 476 阅读 · 0 评论 -
《机器学习实战》训练营——(10月10日作业)
原创 2018-10-27 20:10:50 · 315 阅读 · 0 评论 -
《机器学习实战》第一章——机器学习基础——笔记
1.机器学习的一个主要任务就是分类。2.学习如何分类需要做算法训练,为算法输入大量已分类数据作为算法的训练集。3.分类问题中的目标向量称为类别,并假定分类问题只存在有限个数的类别。4.训练数据和测试数据。5.假定某一个算法,经过测试满足精确度要求,已经学会了如何分类,这部分工作称之为知识表示。6.机器学习的另一个主要任务就是回归,主要用于预测数值型数据。7.分类和回归属于监...原创 2018-09-27 14:10:43 · 242 阅读 · 0 评论 -
《机器学习实战》训练营——(10月12日作业)
将本章中“使用朴素贝叶斯过滤垃圾邮件”完整代码键入jupyter notebook,并添加详细注释。若有可能,自己可以优化该代码。代码链接如下:https://github.com/wangxw1023/MachineLearningInAction-Camp/blob/master/naiveBayes.ipynb...原创 2018-10-12 19:44:14 · 157 阅读 · 0 评论 -
《机器学习实战》第二章——k-近邻算法——笔记
在看这一章的书之前,在网上跟着博主Jack-Cui的博客学习过,非常推荐。博客地址:http://blog.csdn.net/c406495762 《Python3《机器学习实战》学习笔记(一):k-近邻算法(史诗级干货长文)》讲述的非常细致,文字幽默有趣,算法细节也讲述的非常清楚,较书中而言还有sklearn调库的补充内容。因此,在这里,我只总结自己的笔记。1.本章内容主要包...原创 2018-09-28 17:03:00 · 223 阅读 · 0 评论 -
《机器学习实战》训练营——(10月8日作业)
10月8日的作业2:在构建一个决策树模型时,我们对某个属性分割节点,下面四张图中,哪个属性对应的信息增益最大?1.参照《统计学习方法》梳理了信息增益的定义;2.列出了信息增益的算法流程;3.对于作业中给出的四张图,按照算法流程进行了信息增益的计算,最后得出outlook属性对应的信息增益最大;4.收获:熟悉了信息增益的算法流程,并能够手动计算;熟悉了LaTeX的语法,确实排版出来的...原创 2018-10-09 15:00:09 · 343 阅读 · 0 评论 -
《机器学习实战》训练营——(10月9日作业)
作业3:将本章中“使用决策树预测隐形眼镜类型”完整代码键入jupyter notebook,并添加详细注释。若有可能,自己可以优化该代码。代码链接:https://github.com/wangxw1023/MachineLearningInAction-Camp/blob/master/DecisionTree.ipynb总结:照着书上的代码敲,经常因为换行不注意,出错,导致结果没有...原创 2018-10-09 21:30:08 · 633 阅读 · 0 评论 -
《机器学习实战》训练营——(10月16日作业)
将本章中“从疝气病症预测病马的死亡率”完整代码键入jupyter notebook,并添加详细注释。若有可能,自己可以优化该代码。https://github.com/wangxw1023/MachineLearningInAction-Camp/blob/master/logistic_test01.ipynb...原创 2018-10-16 16:08:27 · 239 阅读 · 0 评论 -
《机器学习实战》训练营——(10月9日作业)决策树之信息增益
原创 2018-10-27 20:00:17 · 208 阅读 · 0 评论 -
《机器学习实战》训练营——(10月11日作业)
朴素贝叶斯分类方法的原理朴素贝叶斯方法是贝叶斯决策理论的一部分。贝叶斯决策理论的核心思想即选择具有最高概率的决策。 朴素贝叶斯法是基于贝叶斯定理和特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y。朴素贝叶斯分类方法为什么称之为朴素?之所谓称为朴素,是因为整个形式...原创 2018-10-11 15:43:25 · 403 阅读 · 0 评论