机器学习
文章平均质量分 88
荔枝童鞋
这个作者很懒,什么都没留下…
展开
-
推荐
机器学习的5种兵法: http://dy.qq.com/article.htm?id=20151027A00CC700原创 2015-11-01 23:41:22 · 342 阅读 · 0 评论 -
pandas数据处理
用pandas进行数据分析,对数据预处理,以及简单例子说明 concat 用于将2个DataFrame连接到一起,一般是将训练集与测试集连接在一起对属性值进行预处理。个人感觉这样处理是可以的,因为对属性值的处理一般要求数值越多越好,而且对训练集与测试集的数据预处理要求要是一样的。只要在训练模型的时候讲2者分开就行。 相同列合并到一起,不同时新建列,缺省值为NaN df1 =Da原创 2015-11-18 23:43:50 · 19587 阅读 · 0 评论 -
随机森林小结
机器学习中,随机森林是一种组合方法,由许多的决策树组成,因为这些决策树的形成采用了随机的方法,因此也叫做随机决策树。随机森林中的树之间是没有关联的。当测试数据进入随机森林时,其实就是让每一颗决策树进行分类,最后取所有决策树中分类结果最多的那类为最终的结果。因此随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。 随机森林由决策树组成,决策树实际上是将空间用超平面原创 2015-11-24 01:30:52 · 16365 阅读 · 4 评论 -
决策树原理-python实现
《机器学习实战》 CH3 决策树基本原理与实现。 决策树基本原理可以概括为:通过计算信息增益划分属性集,选择增益最大的属性作为决策树当前节点,依次往下,构建整个决策树。为了计算熵,需要先计算每个属性的信息增益值,通过下面公式计算: 创建数据集: def createDataSet(): dataSet = [ [1, 1, 'yes'], [1, 1原创 2016-05-24 00:15:34 · 7720 阅读 · 1 评论 -
KNN原理-python实现
《机器学习实战》 KNN-python实现原创 2016-05-18 22:22:08 · 3152 阅读 · 0 评论