机器学习
火星的时代6
没有
展开
-
几种交叉验证方式比较及应用
模型评价的目的:通过模型评价,我们知道当前训练模型的好坏,泛化能力如何?从而知道是否可以应用在解决问题上,如果不行,那又是哪里出了问题?本文涉及(1)交叉验证的方式比较、(2)交叉验证的scoring参数1、交叉验证方式比较train_test_split在分类问题中,我们通常通过对训练集进行train_test_split,划分成train 和test 两部分,其中tr...原创 2019-05-20 15:50:53 · 2976 阅读 · 0 评论 -
数据预处理:非数值型特征如何进行编码
一般机器学习数据预处理过程中,对于非数值型特征编码可以采用如下几种方式:1、one-hot编码(独热编码)2、映射有序特征one-hot编码(独热编码):如果该特征下可以分为多个类别,且各类别是并列关系,则适合使用one-hot编码方式进行处理。例如,衣服的颜色red、green、yellow就是属于这种并列关系一般机器学习数据预处理过程中,对于非数值型特征编码可以采用如...原创 2019-05-17 20:22:25 · 7027 阅读 · 1 评论 -
ROC与AUC
1、ROC、AUC概念介绍2、ROC曲线绘制原理3、ROC的曲线面积AUC4、ROC曲线优点1、ROC、AUC概念介绍ROC的全名叫做Receiver Operating Characteristic,其主要分析工具是一个画在二维平面上的曲线——ROC curve。平面的横坐标是false positive rate(FPR),纵坐标是true positive rate...原创 2019-05-22 18:30:35 · 784 阅读 · 0 评论