数据分析
XiongLY0
普普通通
展开
-
【数据分析实践】 Task1.1 模型构建
导入本次实践过程中所需的包:import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.model_selection import train_test_splitfrom sklearn.linear_model import LogisticRegressionfrom skle...原创 2019-01-03 19:46:45 · 440 阅读 · 0 评论 -
【数据分析实践】Task 1.2 模型构建之集成模型
模型构建之集成模型构建随机森林、GBDT、XGBoost和LightGBM这四个模型,并对每一个模型进行评分,评分方式任意,例如准确度和auc值。本篇代码运行均建立在上一篇(【数据分析实践】 Task1.1 模型构建)代码的运行基础上集成模型构建模型训练:rf_clf = RandomForestClassifier(random_state=2018).fit(X_train, y...原创 2019-01-04 21:45:43 · 359 阅读 · 0 评论 -
【数据分析实践】Task 1.3 模型评估
构建随机森林、GBDT、XGBoost和LightGBM这四个模型,并对每一个模型进行评分,评分方式任意,例如准确度和auc值。本篇代码均建立在上一篇(【数据分析实践】 Task1.1 模型构建)代码已运行的基础上模型构建导入包import pandas as pdimport matplotlib.pyplot as pltfrom sklearn.model_selection...原创 2019-01-07 21:49:27 · 1541 阅读 · 0 评论 -
【一周算法实践进阶】任务1 数据预处理
导入本次实践过程中所需的包:import pandas as pdfrom sklearn.preprocessing import LabelBinarizer, Imputer准备数据数据集下载实践数据的下载地址 https://pan.baidu.com/s/1wO9qJRjnrm8uhaSP67K0lw说明:这份数据集是金融数据(非原始数据,已经处理过了),我们要做的是预测贷...原创 2019-01-25 17:05:58 · 820 阅读 · 1 评论 -
【数据分析实践】Task 1.3 模型调优
导入本次实践过程中所需的包:import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.model_selection import train_test_split, GridSearchCVfrom sklearn.linear_model import LogisticRegres...原创 2019-01-09 22:03:58 · 470 阅读 · 0 评论 -
【一周算法实践进阶】任务3 模型融合(Stacking)
导入本次任务所用到的包:import pandas as pdfrom sklearn.model_selection import train_test_split, KFold, GridSearchCVimport numpy as npimport warningsimport matplotlib.pyplot as pltfrom sklearn.metrics impor...原创 2019-01-31 22:03:59 · 1975 阅读 · 1 评论 -
【一周算法实践进阶】任务2 特征工程
导入本次任务所用到的包:import pandas as pdimport numpy as npfrom scipy import statsimport matplotlib.pyplot as pltfrom sklearn.model_selection import train_test_split, GridSearchCVfrom sklearn.linear_model...原创 2019-01-29 21:48:11 · 1184 阅读 · 1 评论