自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

诗蕊的专栏

put your heart into it

  • 博客(4)
  • 收藏
  • 关注

原创 用xgboost构建一个简单的模型

这篇文章我们使用xgboost构建一个简单的模型以及xgboost与scikit-learn一起使用构建模型,用到的数据集是UCI机器学习库的mushroom数据集,用数据集中的22个特征来判断蘑菇是否有毒,步骤如下: 1. 导入模型需要的工具包,这里面我们用到了xgboost, sklearn, matplotlib, time, graphvizimport xgboost as xgb...

2018-03-27 11:23:42 4498

原创 MAC OS上安装XGBoost步骤

安装Python环境 MAC OS 已在带Python 2.7,此步请忽略。 安装Homebrew Homebrew类似于ubuntu中的apt-get和centos中的yum,是OSX里面的一个非常有用软件安装工具. 安装这个软件的目的在于更新gcc版本,官方文档中说最新的gcc版本才使XGBoost支持多线程。 直接将上述代码粘贴至终端即可安装,下同(除非特别说明)。/usr/bin...

2018-03-24 20:44:35 1019

原创 7种常见的机器学习算法衡量指标

在做机器学习进行实验过程中,我们需要使用分类精度、均方误差等方法衡量模型的性能,从而判断训练出的模型的表现是否符合预期要求。本文整理了7种常见的机器学习算法衡量指标:分类精度、对数损失、混淆矩阵、曲线下面积(AUC)、F1分数、平均绝对误差、均方误差。1. 分类精度分类精度其实就是我们所说的准确性,是正确预测数占总样本数的比值。 Accuracy=NumberofCorrectpredi...

2018-03-17 00:12:02 5817

原创 常见的六大聚类算法

1. K-Means(K均值)聚类算法步骤: (1) 首先我们选择一些类/组,并随机初始化它们各自的中心点。中心点是与每个数据点向量长度相同的位置。这需要我们提前预知类的数量(即中心点的数量)。 (2) 计算每个数据点到中心点的距离,数据点距离哪个中心点最近就划分到哪一类中。 (3) 计算每一类中中心点作为新的中心点。 (4) 重复以上步骤,直到每一类中心在每次迭代后变化不大为止。也可...

2018-03-01 17:35:06 317333 35

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除