机器学习
曳落
数据策略,数据挖掘
展开
-
【转】(Python)序列数据的One Hot编码
转自:https://yq.aliyun.com/articles/126741机器学习算法无法直接用于数据分类。数据分类必须转换为数字才能进一步进行。在本教程中,你将发现如何将输入或输出的序列数据转换为一种热编码,以便于你在Python中深度学习的序列分类问题中使用。看完本教程后,你将会了解:· 1.什么是整数编码和One-Hot编码,以及为什么它们在机器学习中是必需的。· 2.如何在P...转载 2018-07-09 20:56:59 · 537 阅读 · 0 评论 -
【转】逻辑回归LR的特征为什么要先离散化
转自:文章在工业界,很少直接将连续值作为特征喂给逻辑回归模型,而是将连续特征离散化为一系列0、1特征交给逻辑回归模型,这样做的优势有以下几点:1. 稀疏向量内积乘法运算速度快,计算结果方便存储,容易scalable(扩展)。2. 离散化后的特征对异常数据有很强的鲁棒性:比如一个特征是年龄>30是1,否则0。如果特征没有离散化,一个异常数据“年龄300岁”会给模型造成很大的干扰。3. 逻辑回归...转载 2018-07-12 20:59:56 · 414 阅读 · 0 评论 -
【转】ROC曲线与AUC值
转自:https://www.cnblogs.com/gatherstars/p/6084696.html本文根据以下文章整理而成,链接:(1)http://blog.csdn.net/ice110956/article/details/20288239(2)http://blog.csdn.net/chjjunking/article/details/5933105 1.概述...转载 2018-07-25 16:52:51 · 293 阅读 · 0 评论 -
【转】sklearn.metrics中的评估方法介绍
转自:sklearn.metrics中的评估方法介绍(accuracy_score, recall_score, roc_curve, roc_auc_score, confusion_matrix)accuracy_score分类准确率分数是指所有分类正确的百分比。分类准确率这一衡量分类器的标准比较容易理解,但是它不能告诉你响应值的潜在分布,并且它也不能告诉你分类器犯错的类型。形式:...转载 2018-07-25 17:04:00 · 17533 阅读 · 0 评论 -
评价模型的常用方法——精确率、召回率、F1 值、ROC、AUC 各自的优缺点是什么?
转自:https://www.zhihu.com/question/30643044/answer/222274170来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。精确率、召回率、F1、AUC和ROC曲线其实都是评价模型好坏的指标,而且相互之间是有关系的,只是侧重点不同,题主如果理解了各指标的定义就能找出他们的区别与联系,下面就用一个例子解释这些指标。以白...转载 2018-08-22 09:56:10 · 7859 阅读 · 0 评论 -
Precision、Recall、F-measure、ROC曲线、AUC理解
首先,在试图弄懂AUC和ROC曲线之前,一定,一定要彻底理解混淆矩阵的定义!!!混淆矩阵中有着Positive、Negative、True、False的概念,其意义如下:称预测类别为1的为Positive(阳性),预测类别为0的为Negative(阴性)。 预测正确的为True(真),预测错误的为False(伪)。对上述概念进行组合,就产生了如下的混淆矩阵:然后,由此引出Tru...原创 2018-11-25 11:03:15 · 732 阅读 · 0 评论