随机森林
CDA·数据分析师
分享数据分析和人工智能领域的干货或外文翻译,囊括数据挖掘、数据分析、大数据分析、机器学习、深度学习、神经网络、算法工程、AI科技。还有职场经验交流、时代热门资讯,以及人生的点点滴滴。望大家一起努力,成为更好的自己!
展开
-
机器学习之随机森林(一)
如果大家想学人工智能的话,那么就一定不能够忽视有关机器学习的内容。这时候就会有人问,什么是机器学习?所谓机器学习就是一门多领域交叉学科,涉及概率论、统计学、逼近论等多门学科。机器学习是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能的一门技术,而机器学习中随机森林是一个十分重要的算法,在这篇文章中我们就详细给大家介绍一下随机森林的相关...原创 2019-02-20 16:57:51 · 1816 阅读 · 1 评论 -
机器学习之随机森林(二)
在上一篇文章中我们简单给大家介绍了关于机器学习的知识,顺便也讲了讲机器学习误差的原因。其实不管是什么算法都是有方差和偏差存在的。在理想情况下,机器学习的误差就会小的很多。随机森林是可以减少方差的,而我们在上一篇文章中也留给大家两个问题,第一是随机森林是怎么减少这种误差?第二个问题是随机森林有什么优缺点。带着这两个问题,我们给大家介绍一下这些内容。其实随机森林一种可以减少方差的算法,如果大家接触...原创 2019-02-20 17:06:27 · 418 阅读 · 0 评论 -
机器学习之随机森林(三)
随机森林在机器学习中是一个十分重要的算法,大家可能对机器学习感到很陌生,但是大家一定不会对人工智能感到陌生。而机器学习是人工智能中是一个十分重要的内容,而随机森林又是机器学习中的内容。由此可见,随机森林是值得我们去学习的,在前面我们也给大家介绍了很多关于随机森林的知识,接下来的内容我们继续为大家讲述随机森林的最后一部分。我们在前面的文章中讲述了随机森林是怎么降低偏差和方差的,但是大家是否知道随...原创 2019-02-20 17:11:45 · 1164 阅读 · 0 评论 -
随机森林在乳腺癌数据上的调参
这篇文章中,使用基于方差和偏差的调参方法,在乳腺癌数据上进行一次随机森林的调参。乳腺癌数据是sklearn自带的分类数据之一。案例中,往往使用真实数据,为什么我们要使用sklearn自带的数据呢?因为真实数据在随机森林下的调参过程,往往非常缓慢。真实数据量大,维度高,在使用随机森林之前需要一系列的处理,因此不太适合用来做直播中的案例演示。原本,我为大家准备了kaggle上下载的辨别手写数字的数...原创 2019-03-12 14:15:48 · 653 阅读 · 1 评论 -
随机森林在sklearn中的实现
小伙伴们大家好~o( ̄▽ ̄)ブ,我是菜菜,我的开发环境是Jupyter lab,所用的库和版本大家参考:Python 3.7.1(你的版本至少要3.4以上Scikit-learn 0.20.0 (你的版本至少要0.19Numpy 1.15.3, Pandas 0.23.4, Matplotlib 3.0.1, SciPy 1.1.01 概述1.1 集成算法概述集成学习(ensemble...原创 2019-03-13 13:51:07 · 2729 阅读 · 0 评论