Kaggle
王氏小明
这个作者很懒,什么都没留下…
展开
-
Kaggle实战(四): XGBoost调参
以Kaggle 2015年举办的Otto Group Product Classification Challenge竞赛数据为例,进行XGBoost参数调优探索。竞赛官网:https://www.kaggle.com/c/otto-group-product-classification-challenge/data# 导入模块,读取数据from xgboost import XGB...原创 2019-12-30 21:22:46 · 1423 阅读 · 0 评论 -
Kaggle实战(三): 数据集的特征工程
本节主要介绍对于所给的数据,进行特征变换以及构造新的特征import numpy as npimport pandas as pdfrom sklearn.feature_extraction.text import CountVectorizerfrom sklearn.feature_extraction.text import TfidfVectorizerfrom scip...原创 2019-12-05 21:04:44 · 916 阅读 · 0 评论 -
Kaggle实战(二):数据集特征分析与展示
本文对原始数据集中的特征进行分析与展示import numpy as np # linear algebraimport pandas as pd # data processing, CSV file I/Oimport matplotlib.pyplot as pltfrom sklearn.preprocessing import LabelEncoderimport seab...原创 2019-12-04 21:15:55 · 1571 阅读 · 0 评论 -
Kaggle实战(一):数据相关性分析
1.特征相关性分析# 导入必要模块import numpy as np # linear algebraimport pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)import matplotlib.pyplot as pltimport seaborn as sns # 一个简单的画图函数color...原创 2019-12-04 16:08:58 · 1038 阅读 · 1 评论 -
Kaggle实战(一):泰坦尼克获救预测
1.数据集简介此数据集一共有891条数据,数据内容如下,每列表示的意义如下:乘客ID 是否幸存 舱位等级 姓名 性别 年龄 一同上船的兄弟姐妹 父母和小孩数目 船号 船价 船仓号 登录地点 PassengerId Survived Pclass Name Sex Age SibSp ...原创 2019-11-25 11:45:00 · 550 阅读 · 1 评论