sklearn
Lavi_qq_2910138025
这个作者很懒,什么都没留下…
展开
-
scikit-learn中评估分类器性能的度量,像混淆矩阵、ROC、AUC等
评估分类器性能的度量,像混淆矩阵、ROC、AUC等内容概要模型评估的目的及一般评估流程分类准确率的用处及其限制混淆矩阵(confusion matrix)是如何表示一个分类器的性能混淆矩阵中的度量是如何计算的通过改变分类阈值来调整分类器性能ROC曲线的用处曲线下面积(Area Under the Curve, AUC)与分类准确率的不同1. 回顾模型评估可以用于在不同的模型类型、调节转载 2017-11-08 14:36:44 · 6201 阅读 · 0 评论 -
使用sklearn进行数据预处理 —— 标准化/归一化/正则化
使用sklearn进行数据预处理 —— 标准化/归一化/正则化一、标准化(Z-Score),或者去除均值和方差缩放公式为:(X−mean)/std(X-mean)/std 计算时对每个属性/每列分别进行。将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。转载 2017-10-14 21:25:19 · 815 阅读 · 0 评论 -
scikit-learn中交叉验证及其用于参数选择、模型选择、特征选择的例子
内容概要训练集/测试集分割用于模型验证的缺点K折交叉验证是如何克服之前的不足交叉验证如何用于选择调节参数、选择模型、选择特征改善交叉验证1. 模型验证回顾进行模型验证的一个重要目的是要选出一个最合适的模型,对于监督学习而言,我们希望模型对于未知数据的泛化能力强,所以就需要模型验证这一过程来体现不同的模型对于未知数据的表现效果。 最先我们用训练准确度(用全部数据进行训练和测试)来衡量模型的转载 2017-11-09 15:05:36 · 5669 阅读 · 0 评论 -
sklearn中fit、fit_transform、transform的区别
1 前言在使用sklearn处理数据的时候,会经常看到fit_tranform(),但是偶尔也会遇到fit()和transform()函数,不太明白怎么使用,于是查询资料整理一下。2 理解fit:原义指的是安装、使适合的意思,其实有点train的含义但是和train不同的是,它并不是一个训练的过程,而是一个适配的过程,过程都是定死的,最后只是得到了一个统一的转换的规则模型。transfor...转载 2018-10-12 16:03:49 · 13116 阅读 · 0 评论