机器学习
追风少年lulei
这个作者很懒,什么都没留下…
展开
-
Python实现机器学习一(实现一元线性回归)
回归是统计学中最有力的工具之一。机器学习监督学习算法分为分类算法和回归算法两种,其实就是根据类别标签分布类型为离散型、连续性而定义的。顾名思义,分类算法用于离散型分布预测,如前面讲过的KNN、决策树、朴素贝叶斯、adaboost、SVM、Logistic回归都是分类算法;回归算法用于连续型分布预测,针对的是数值型的样本,使用回归,可以在给定输入的时候预测出一个数值,这是对分类方法的提升,因为这样可原创 2015-10-24 16:29:45 · 24019 阅读 · 4 评论 -
Python实现机器学习二(实现多元线性回归)
接着上一次的一元线性回归http://blog.csdn.net/lulei1217/article/details/49385531往下讲,这篇文章要讲解的多元线性回归。1、什么是多元线性回归模型?当y值的影响因素不唯一时,采用多元线性回归模型。 y =y=β0+β1x1+β2x2+...+βnxn例如商品的销售额可能不电视广告投入,收音机广告原创 2015-10-25 15:45:11 · 64728 阅读 · 14 评论 -
sklearn.preprocessing.PolynomialFeatures类的使用
在之前的代码中多次出现了使用sklearn.pipeline.Pipeline和sklearn.preprocessing.PolynomialFeatures这两个类。我在找相关资料的时候发现很少有写这方面的文章和博客。除了官网的英文文档,其实这个文档写的非常好。但考虑到自己的英文水平有限,于是想写点什么来记录这两个类。1、sklearn.preprocessing.PolynomialFe原创 2015-11-02 09:40:07 · 16499 阅读 · 1 评论 -
sklearn.pipeline.Pipeline类的用法
这一篇我会总结sklearn.pipeline.Pipeline。1、sklearn.pipeline.Pipeline类先给出官方的文档链接:http://scikit-learn.org/stable/modules/generated/sklearn.pipeline.Pipeline.htmlclass sklearn.pipeline.Pipeline(steps)翻译 2015-11-02 10:13:49 · 18948 阅读 · 0 评论 -
python实现机器学习之随机森林
这几天一直在看随机森林。可以说遇到任何一个有关预测的问题。都可以首先随机森林来进行预测,同时得到的结果也不会太差。在这篇文章里我首先会向大家推荐几篇写的比较好的博客。接着会将我觉得比较好的例子使用python+scikit-learn包来实现出来。首先推荐的就是:随机森林入门—简化版http://www.analyticsvidhya.com/blog/2014/06/introduc原创 2015-11-02 10:17:14 · 40768 阅读 · 6 评论 -
python实现机器学习之决策树
这几天在看决策树算法,发现这算法在实际的应用中使用挺多的。所以想总结一下:这里给出一些我觉得比较好的博客链接:http://blog.jobbole.com/86443/ 通俗易懂,同时也讲了一些决策树算法:如ID3、C4.5之类的。以及建立完完整的决策树之后,为了防止过拟合而进行的剪枝的操作。决策树算法介绍及应用:http://blog.jobbole.com/89072/ 这篇博文原创 2015-11-02 10:35:18 · 10386 阅读 · 1 评论