- 博客(4)
- 收藏
- 关注
原创 集训数据竞赛打卡——day4(模型选择)
from __future__ import print_functionimport lightgbm as lgbimport sklearnimport numpyimport hyperoptfrom hyperopt import hp, fmin, tpe, STATUS_OK, Trialsimport coloramaimport numpy as npN_HY...
2020-01-15 23:06:14 166
原创 集训数据竞赛打卡——day3(特征工程)
#核心代码举例# 统计特征 #计算均值 gp = train.groupby(by)[fea].mean() #计算中位数 gp = train.groupby(by)[fea].median() #计算方差 gp = train.groupby(by)[fea].std() #计算最大值 gp = train.groupby(...
2020-01-15 10:08:13 222
原创 集训数据竞赛打卡——day2
#coding:utf-8#导入warnings包,利用过滤器来实现忽略警告语句。import warningswarnings.filterwarnings('ignore')# GBDTfrom sklearn.ensemble import GradientBoostingRegressor# XGBoostimport xgboost as xgb# LightGBM...
2020-01-15 09:59:35 161
原创 集训数据竞赛打卡——EDA
1拿到数据,先大概看一下数据总体(1)查看数据共有几行几列train_data.shape()(2)查看数据有没有缺失值train_data.isnull().sum()(3)查看数据的前几行train_data.head()注意,查看数据的几行几列和是否有缺失值,每列数据类型是什么,也可以使用train_data.info()。但用shape()和isnull(...
2020-01-07 23:51:48 189
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人