r语言
qq_29412441
这个作者很懒,什么都没留下…
展开
-
RandomForest新手自学笔记(多个网站博客整理)
随机森林定义:用以执行回归和分类任务的多功能机器学习算法,是一种数据降维手段,用于处理缺失值、异常值以及其他数据探索中的重要步骤。原理:1. 用N来表示训练用例(样本)的个数,M表示特征数目。2. 输入特征数目m,用于确定决策树上一个节点的决策结果;其中m应远小于M。3. 从N个训练用例(样本)中以有放回抽样的方式,取样N次,形成一个训练集(即bootstrap取样),并用未抽到的用例(样本)作预测,评估其误差。4. 对于每一个节点,随机选择m个特征,决策树上每个节点的决定都是基于这些特征确定原创 2017-04-30 19:51:16 · 12699 阅读 · 0 评论 -
RandomForest中set.seed的作用
1. set.seed(3000)的意思是以3000为种子,而非重复3000次2. 随机森林的核心思想是随机,因此离不开随机数产生的函数3. 之所以把seed写出来, 便于不同人在编译的时候结果不同,seed一样的话,可以保证不同人收到相同的结果4. seed对nTree和nFactor没有影响,但是如果nTree小的话,seed不同结果会差很大5. seed函数每次调用都会根据上原创 2017-05-01 21:09:52 · 4486 阅读 · 0 评论