![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 81
coffeetea01
这个作者很懒,什么都没留下…
展开
-
决策树系列之决策树知识点
1、什么是决策树;(decision tree)决策树是一种树型结构,其中: 每个内部的结点表示在一个属性的测试; 每个分支代表一个测试的输出; 每个叶节点代表一种类别;决策树是以实例为基础的归纳学习,采取的是自顶向下的递归方法;其基本思想是,以信息熵为度量构建一颗熵值下降最快的树,到叶子结点处的熵值为0,此时所有的叶节点的熵值都属于同一类。附上:叶节点的信息熵公式为:2、决策树...原创 2018-05-14 15:18:45 · 1892 阅读 · 0 评论 -
随机森林算法梳理
【任务一 随机森林算法梳理】集成学习概念集成学习简单理解就是指采用多个分类器对数据集进行预测,从而提高整体分类器的泛化能力。换个角度考虑,训练完成之后就可以看成是单独的一个”假设”(或模型),只是该”假设”不一定是在原”假设”空间里的。因此,Ensemble方法具有更多的灵活性。理论上来说,Ensemble方法也比单一模型更容易过拟合。但是,实际中有一些方法(尤其是Bagging...原创 2019-03-01 21:36:17 · 845 阅读 · 0 评论 -
Task1
1. 下载数据,读取数据,观察数据2. 将训练集拆分为训练集和验证集。要求:数据3-7分,随机种子2019分享自己对数据以及赛题的理解和发现 (建立模型通过长文本数据正文(article),预测文本对应的类别(class) )回答:1、已经下载数据2、代码:import osos.chdir('D:\\竞赛\\task1\\new_data\\')#...原创 2019-03-01 21:57:06 · 194 阅读 · 0 评论 -
Task2 GBDT算法梳理
【Task2 GBDT算法梳理】一、简介:GBDT有很多简称,有GBT(Gradient Boosting Tree), GTB(Gradient Tree Boosting ), GBRT(Gradient Boosting Regression Tree), MART(Multiple Additive Regression Tree),其实都是指的同一种算法,本文统一简称GBDT。...原创 2019-03-03 21:59:51 · 459 阅读 · 0 评论