数据挖掘
文章平均质量分 57
对面『胶己人』
This is my note, not my blog
展开
-
数据挖掘之模型评估(AUC和F-measure)
最近在打一个数据挖掘的比赛,看到评分标准如下: 按如下公式计算得分: score=0.6×auc+0.4×F1 其中: auc值为在测试集上,根据预测结果按照标准auc定义计算的分值; F1值为针对测试集中实际标签为1(风险用户)的用户,根据预测结果,按照标准F-measure定义计算的分值。 对于一个刚接触数据挖掘的人来说,连评分规则都没看懂,GG了,于是果断...原创 2018-05-09 15:26:50 · 6213 阅读 · 0 评论 -
数据挖掘之模型初探
由于我要打的比赛是做一个二分类预测器,所以就开始找到有关的模型进行了解学习。常见的分类模型如下: 逻辑回归(Logistic Regression, LR) 朴素贝叶斯(Naive Bayes, NB) K近邻(K-nearest neighbors, KNN) 决策树(Decision Tree, DT) 支持向量机(Support Vector Machine, SVM) 神经网络(Neu...原创 2018-05-13 10:05:05 · 278 阅读 · 0 评论 -
数据挖掘之实例学习
在简书上看到一个简单的数据挖掘流程文章,很不错: 数据科学入门,使用 xgboost 初试 kaggle 这里面有用到网格搜索: 网格搜索简介 sklearn.model_selection.GridSearchCV 中文版网格搜索文档 Python超参数自动搜索模块GridSearchCV上手...原创 2018-05-13 13:03:57 · 3635 阅读 · 0 评论 -
数据挖掘之特征工程
标签编码与独热编码 OneHotEncoder独热编码和 LabelEncoder标签编码 数据挖掘的基本流程 dfs dsf原创 2018-05-13 15:12:04 · 381 阅读 · 0 评论