自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (2)
  • 收藏
  • 关注

原创 GBDT梯度提升树原理剖析

GBDT梯度提升树原理剖析在前面的文章中,我写了ID3及CART决策树的思路,但我们只是将其用来做分类。注意到CART的名字:Classification And Regression Tree,当我们利用其进行回归时,它的名字就变成了回归树。GBDT(Gradient Boosting Decision Tree)就是一种基于回归的预测方法。今天我们来看一看这个算法的原理。先来熟悉一下回归树的方法

2017-10-18 11:15:45 1124

原创 CART决策树的sklearn实现及其GraphViz可视化

这一部分,我使用了sklearn来调用决策树模型对葡萄酒数据进行分类。在此之外,使用Python调用AT&T实验室开源的画图工具GraphViz软件以实现决策树的可视化。from sklearn.datasets import load_irisfrom sklearn import treefrom sklearn.externals.six import StringIOimport py

2017-10-13 15:25:45 29872 15

原创 决策树ID3算法及其Python实现

决策树是一个有向无环图,由节点和有向边组成,根节点代表所有的样例,内部节点表示样例的一个属性,叶节点代表一个类。我们先来看WikiPedia上给出的例子,从而对决策树有一个直观理解。 这个图里,我们可以看到,是否出门浪要受到几个变量的影响:天气、温度、湿度、多云这四个,是一个14行5列的数据集。根据这个数据集,我们可以得到下面的决策树。 最开始的根节点上,包括14个样例,分别是9个浪、5个不浪。

2017-10-13 15:15:53 4347

原创 GraphViz配置指南

GraphViz是AT&T Lab开发的开源工具包,用于绘制dot语言脚本描述的图形,我们只需要关心点和边的关系,不需考虑布局、位置等,用来结合Python绘制图模型真是再好不过。下面来介绍一下Windows 10下GraphViz的配置方法。安装http://www.graphviz.org/Download_windows.php 在该链接中下载graphviz-2.38.msi,一路安装ne

2017-10-13 15:02:03 5726 3

原创 K-Means聚类分析及其Python实现

聚类是机器学习问题中无监督学习的一个典型例子。在实际中,并非所有样本都可以贴上标签,在数据量极为庞大的时候,比如视频帧标注,对每个样本都进行贴注标签需要耗费极大精力。在无监督问题中,训练样本是没有标签的,如何对无标签训练样本进行学习,发现其内在的分布结构,同样是学术界和工业界赖以追求解决的一个问题,也是机器学习的一个未来发展方向。聚类将给定的样例集划分为若干个互不相交的子集。

2017-10-10 15:33:42 3459

原创 用起来不太朴素的朴素贝叶斯及其Python实现

作为一个听起来非常Naive的分类器,Naive Bayes Classifier使用了“属性条件独立性假设”,也就是假设所有属性相互独立。分类器的目的,是对任一测试样本xx,利用贝叶斯定理求出后验概率最大的输出类。

2017-10-07 12:32:03 3715 4

葡萄酒数据集/三元分类

葡萄酒数据集,原始数据,三类别,分别含59、71、48个样本。zip内含描述文件。

2017-10-07

葡萄酒数据集

葡萄酒数据集,二元分类。共130个样本,分别为59+71个。用于SVM、贝叶斯等验证。

2017-10-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除