数据挖掘比赛整理
文章平均质量分 94
数据挖掘比赛整理
roy_blue
算法工程师,希望和大家共同提高,欢迎关注,关注必回
展开
-
[一周算法进阶]--任务三-模型融合
Task3.模型融合用你目前评分最高的模型作为基准模型,和其他模型进行stacking融合,得到最终模型及评分果。1.导入相关包&读取数据import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.preprocessing import LabelBinarizer,OneH...原创 2019-01-31 21:45:53 · 238 阅读 · 0 评论 -
[特征工程]---OneHotEncoder与CountVectorizer
1.OneHotEncoderfrom sklearn.preprocessing import OneHotEncoder,LabelEncoder#enc=OneHotEncoder()#enc.fit(data_100)#ans=enc.transform(data_200).toarray()le = LabelEncoder()le.fit(data_100)a...原创 2019-01-29 23:09:12 · 531 阅读 · 0 评论 -
【一周算法进阶】--任务二 特征工程
Tast2 特征工程特征选择:分别用IV值和随机森林进行特征选择。再用【算法实践】中的7个模型(逻辑回归、SVM、决策树、随机森林、GBDT、XGBoost和LightGBM),进行模型评估。 1.什么是IV值? Information Value(信息价值,信息量)本人是第一次接触IV值,先来一波介绍:简单来说,IV值是用来衡量变量的预测能力,类似的有基尼系数,信息增益等。我们在构建模...原创 2019-01-29 20:58:22 · 638 阅读 · 0 评论 -
【一周算法进阶】--任务一数据预处理
Task1 数据预处理说明:数据集是关于金融方面,预测贷款用户是否会逾期。表格中“status”是结果标签,0表示未逾期,1表示逾期。1.导入相关包 &读取数据import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.preprocessing import LabelBin...原创 2019-01-26 17:21:45 · 574 阅读 · 0 评论 -
【一周算法实践】--4.模型调优
任务4:模型调优使用网格搜索法对7个模型进行调优(调参时采用五折交叉验证的方式),并进行模型评估。网格搜索(Grid Search)用简答的话来说就是手动的给出一个模型中你想要改动的所用的参数,程序自动的帮你使用穷举法来将所用的参数都运行一遍。决策树中我们常常将最大树深作为需要调节的参数;K次验证:#1. 导入所需包import pandas as pdfrom sklearn.m...原创 2019-01-09 15:37:01 · 233 阅读 · 0 评论 -
【一周算法实践】--3.模型评估
模型评估记录7个模型(逻辑回归、SVM、决策树、随机森林、GBDT、XGBoost和LightGBM)关于accuracy、precision,recall和F1-score、auc值的评分表格,并画出ROC曲线。#1.导入要使用的模块import numpy as npimport pandas as pdfrom sklearn.model_selection import tra...原创 2019-01-07 12:32:33 · 384 阅读 · 0 评论 -
【一周算法实践】__1.模型构建
预测贷款用户是否逾期1.导入模块import numpy as npimport pandas as pdfrom sklearn.model_selection import train_test_split,cross_val_scorefrom sklearn.linear_model import LogisticRegressionfrom sklearn.svm imp...原创 2019-01-03 16:43:43 · 179 阅读 · 0 评论 -
【一周算法实践】__2.模型构建之集成模型
模型构建之集成模型构建RF GBDT XDBoost LightGBM这四个模型,并对每一个模型使用准确率和AUC评分。在上次任务中使用了LR SVM DecisionTree这三个简单的模型对样本进行了预测和评价,请参照https://blog.csdn.net/wxq_1993/article/details/85703936。#1.导入要使用的模块import numpy as np...原创 2019-01-05 15:20:26 · 876 阅读 · 0 评论