自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

datarunner的博客

一个探索学习的小昆虫~

  • 博客(3)
  • 收藏
  • 关注

原创 机器学习算法第一篇:决策树学习(一)

本篇是我学习决策树的一个入门,主要介绍最经典的决策树算法  ID3决策树是由昆兰提出的一种作为分类的算法;它的特点主要是形象,简单易懂,不需要较多的专业领域知识;缺点则是根据不同算法各有不同;本篇先介绍最早由昆兰提出的ID3算法;在昆兰的文章中提出过,决策树算法的产生是来源于概念提取算法;ID3算法的基础概念是信息学概念:信息熵和信息增益信息熵:用来衡量一个随机变量出现的期望值,一个变

2016-01-17 13:39:01 1619

原创 机器学习算法之决策树(三)

之前两篇介绍了ID3,C4.5,本节介绍另一个算法,CART算法,在机器学习实践的书中,本节内容归结于回归部分,因为它分别介绍了分类树和回归树两种,本节主要介绍分类树,下节介绍回归树;首先对比算法;1)最明显的特征莫过于,CART算法是采用二分树进行决策,这就决定了对于多于两个的特征要采用方法进行超变量化;2)剪枝方法,不同于之前的两种算法,CART算法采用代价复杂度剪枝方法;

2016-01-25 14:43:48 740

原创 机器学习算法之决策树(二)

本篇是接着上一篇的决策树算法学习,只要提到决策树算法,提到ID3,就一定会提到它的改进算法:C4.5其实在学习C4.5时我曾经困惑于信息增益率的式子,通过几个例子,和几篇博文,大致理清了它的思路,其实对于基本的算法,每篇博文的讲法大致类似,有时间还是应多拜读一些大师们的论文,有利于对算法更好的理解,这段话是对自己的劝诫;好了,言归正传,说一下算法;首先,C4.5是基于对于ID3的改进:它的

2016-01-18 20:37:19 525

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除