- 博客(4)
- 资源 (2)
- 问答 (1)
- 收藏
- 关注
原创 随机森林小结
机器学习中,随机森林是一种组合方法,由许多的决策树组成,因为这些决策树的形成采用了随机的方法,因此也叫做随机决策树。随机森林中的树之间是没有关联的。当测试数据进入随机森林时,其实就是让每一颗决策树进行分类,最后取所有决策树中分类结果最多的那类为最终的结果。因此随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。随机森林由决策树组成,决策树实际上是将空间用超平面
2015-11-24 01:30:52 16506 4
原创 pandas数据处理
用pandas进行数据分析,对数据预处理,以及简单例子说明concat用于将2个DataFrame连接到一起,一般是将训练集与测试集连接在一起对属性值进行预处理。个人感觉这样处理是可以的,因为对属性值的处理一般要求数值越多越好,而且对训练集与测试集的数据预处理要求要是一样的。只要在训练模型的时候讲2者分开就行。相同列合并到一起,不同时新建列,缺省值为NaNdf1 =Da
2015-11-18 23:43:50 19646
原创 python2.7 matplotlib安装
下载exe:http://download.csdn.net/download/bunnylzq/7830023随便参考个说明http://www.open-open.com/lib/view/open1393488232380.html一路next即可
2015-11-09 23:59:06 635
sklearn里的learning_curve为何会如此占用内存
2015-11-20
TA创建的收藏夹 TA关注的收藏夹
TA关注的人