- 博客(7)
- 资源 (8)
- 收藏
- 关注
原创 数据分析集训营-第六次任务(模型融合)
模型融合==集成学习模型融合又叫做集成学习,集成学习通过组合多个个体学习器来获取比单个个体学习器显著优越的泛化性能,通常选取个体学习器的准则是:个体学习器要有一定的准确性,预测能力不能太差个体学习器之间要有多样性,即学习器之间要有差异。集成学习方式根据个体学习的生成方式,目前的基础学习方法大概分为以下两类:Boosting算法:个体学习器之间存在强依赖关系,必须串行生成Bagg...
2019-08-18 18:30:34 350
原创 数据分析集训营-第五次任务(模型调优)
#!/usr/bin/env python# -*- coding:utf-8 -*- # Author: Jia ShiLin'''调参-参数搜索'''from keras.models import Sequentialfrom keras.layers import Denseimport numpy as np from sklearn.model_selection...
2019-08-18 17:20:52 280
原创 决策树
决策树是一种自上而下,对样本数据进行树形分类的过程,由节点和有向边组成。决策树作为最基础、最常见的有监督学习模型,常被用于分类问题和回归问题,在市场营销和生物医药等领域尤其受欢迎,主要是因为树形结构与销售、诊断等场景下的决策过程非常相似,决策树具有简单直观、解释性强的优点。
2019-08-16 17:03:34 646
原创 数据分析集训营-第四次任务(模型评估)
import pandas as pdimport warningsfrom sklearn.preprocessing import scalefrom sklearn.model_selection import cross_val_scorefrom sklearn.linear_model import LogisticRegressionfrom sklearn.tree im...
2019-08-14 21:56:19 178
原创 数据分析集训营-第三次任务(模型构建)
算法介绍随机森林GBDTXGBoostLightGBM导入包import pandas as pdimport warningsfrom sklearn.preprocessing import scalefrom sklearn.model_selection import cross_val_scorefrom sklearn.linear_model import L...
2019-08-10 21:52:25 2355
原创 数据分析集训营-第二次任务(特征工程)
0.任务要求特征衍生特征挑选:分别用IV值和随机森林等进行特征选择……以及你能想到特征工程处理使用IV值特征选择def calcWOE(dataset, col, target): # 对特征进行统计分组 subdata = df(dataset.groupby(col)[col].count()) # 每个分组中响应客户的数量 suby = df(dat...
2019-08-08 21:55:06 283
原创 数据挖掘集训营-第一次任务(数据分析)
0.数据集说明:金融数据,我们要做的是预测贷款用户是否会逾期。表格中的‘status’是结果标签:0表示未逾期,1表示逾期。要求:数据切分方式 - 三七分,其中测试集30%,训练集70%,随机种子设置为2018任务1:对数据进行探索和分析。时间:2天1.数据预处理# 导入相关包import warningswarnings.filterwarnings("ignore")impor...
2019-08-06 21:46:44 2289
吴恩达深度学习笔记v5.5
2018-08-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人