数据挖掘
文章平均质量分 57
对面『胶己人』
This is my note, not my blog
展开
-
数据挖掘之模型评估(AUC和F-measure)
最近在打一个数据挖掘的比赛,看到评分标准如下: 按如下公式计算得分: score=0.6×auc+0.4×F1 其中: auc值为在测试集上,根据预测结果按照标准auc定义计算的分值; F1值为针对测试集中实际标签为1(风险用户)的用户,根据预测结果,按照标准F-measure定义计算的分值。对于一个刚接触数据挖掘的人来说,连评分规则都没看懂,GG了,于是果断...原创 2018-05-09 15:26:50 · 6127 阅读 · 0 评论 -
数据挖掘之模型初探
由于我要打的比赛是做一个二分类预测器,所以就开始找到有关的模型进行了解学习。常见的分类模型如下:逻辑回归(Logistic Regression, LR)朴素贝叶斯(Naive Bayes, NB)K近邻(K-nearest neighbors, KNN) 决策树(Decision Tree, DT)支持向量机(Support Vector Machine, SVM)神经网络(Neu...原创 2018-05-13 10:05:05 · 263 阅读 · 0 评论 -
数据挖掘之实例学习
在简书上看到一个简单的数据挖掘流程文章,很不错:数据科学入门,使用 xgboost 初试 kaggle这里面有用到网格搜索:网格搜索简介sklearn.model_selection.GridSearchCV中文版网格搜索文档Python超参数自动搜索模块GridSearchCV上手...原创 2018-05-13 13:03:57 · 3608 阅读 · 0 评论 -
数据挖掘之特征工程
标签编码与独热编码OneHotEncoder独热编码和 LabelEncoder标签编码数据挖掘的基本流程 dfs dsf原创 2018-05-13 15:12:04 · 354 阅读 · 0 评论