机器学习实战

在这里插入图片描述

全书使用python作为工具语言,进行相关程序的开发,包括数据分析,数据绘图等。

第一部分介绍的是机器学习基础,带领读者了解一些关键术语、机器学习的主要任务、如何选择合适的算法解决问题,还有如何开发机器学习应用程序。

第二部分主要讲的是K-近邻算法。包括如何使用K-近邻算法改进约会网站的配对效果和使用k-近邻算法进行手写数字的识别。

第三部分主要介绍的是决策树。带领读者了解决策树的构造,并指导读者使用决策树预测隐形眼镜的类型。

第四部分主要介绍的算法是朴素贝叶斯,一种基于概率论的分类方法。指导读者如何使用朴素贝叶斯进行文档分类,其中包括如何从文本中构建词向量,如何从词向量计算概率等;还向读者介绍了如何使用朴素贝叶斯过滤垃圾邮件和如何使用朴素贝叶斯分类器从个人广告中获取区域倾向。

第五部分主要通过逻辑回归介绍学习梯度上升算法,如何找到最佳参数和如何画出决策边界,最后带领读者预测马的死亡率。

第六部分主要介绍的是支持向量机。带领读者学习如何基于最大间隔分割数据,如何寻找最大间隔,如何利用SMO算法加速优化,如何应用核函数。最后使用该方法解决手写数字识别的问题。

第七部分主要介绍如何利益哦那个AdaBoost元算法提高分类器的性能。并介绍了什么事多重抽样,什么是弱分类器与强分类器,如何处理非均衡分类问题还有AdaBoost算法如何实现。最后利用一个复杂数据带领读者应用AdaBoost算法。

第八部分主要是介绍如何用回归算法预测数值型数据。带领读者认识如何使用线性回归找到最佳拟合直线,什么是局部加权线性回归,如何权衡方差与偏差。最后通过预测乐高玩具价格来应用该算法。

第九部分主要介绍树回归。向读者讲解复杂数据的局部性建模,连续和离散型特征树的构建。如何将CART算法用于回归,如何对树进行剪枝。最后向读者介绍了树回归与标准回归的区别。

第十部分主要介绍如何利用K-均值聚类算法对未标注数据进行分组。该章节介绍了如何通过后处理的方式来提高聚类的性能,并通过对地图上的点聚类实战该算法。

第十一部分介绍如何使用APriori算法进行关联分析。告诉读者如何使用Apriori算法来发现频繁集,如何从频繁集中挖掘关联规则。最后通过该算法发现国会投票中的模式,发现毒蘑菇的相似特征。

第十二部分介绍如何使用FP-growth算法来高效发现频繁项集。通过FP树在Twitter源中发现一些共现词,通过新闻网站点击数据进行挖掘。

第十三部分主要介绍的是数据降维算法PCA,带领读者了解如何使用PCA对半导体制造数据进行降维。

第十四部分主要介绍如何利用SVD简化数据。介绍了基于协同过滤的推荐引擎和菜馆菜肴的推荐引擎,最后介绍了SVD在图像压缩上的展现。

第十五章介绍的是Hadoop下的MapReduce计算框架,如何通过该框架将所学的机器学习算法高效运行。

个人记录:

  1. 本书包含相关实战代码。位于云盘中,资料整理/机器学习书籍/机器学习实战书/
  2. 已整理至公众号关键词回复:机器学习实战。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值