比赛实战
文章平均质量分 91
qinjianhuang
努力学习!
展开
-
Scikit中的特征选择,XGboost进行回归预测,模型优化的实战
前天偶然在一个网站上看到一个数据分析的比赛(sofasofa),自己虽然学习一些关于机器学习的内容,但是并没有在比赛中实践过,于是我带着一种好奇心参加了这次比赛。 赛题:足球运动员身价估计 比赛概述 本比赛为个人练习赛,主要针对于于数据新人进行自我练习、自我提高,与大家切磋。 练习赛时限:2018-03-05 至 2020-03-05 任务类...原创 2018-03-24 13:12:45 · 109301 阅读 · 34 评论 -
Pandas使用DataFrame进行数据分析比赛进阶之路(一)
这篇文章中使用的数据集是一个足球球员各项技能及其身价的csv表,包含了60多个字段。数据集下载链接:数据集1、DataFrame.info()这个函数可以输出读入表格的一些具体信息。这对于加快数据预处理非常有帮助。import pandas as pdimport matplotlib.pyplot as pltdata = pd.read_csv('dataset/soccer...原创 2018-03-25 13:31:12 · 6045 阅读 · 1 评论 -
Pandas使用DataFrame进行数据分析比赛进阶之路(二):日期数据处理:按日期筛选、显示及统计数据
首先,表格的数据格式如下:1、获取某年某月数据data_train = pd.read_csv('data/train.csv')# 将数据类型转换为日期类型data_train['date'] = pd.to_datetime(data_train['date'])# 将date设置为indexdf = data_train.set_index('date')# ...原创 2018-04-02 22:20:52 · 13521 阅读 · 3 评论 -
XGboost数据比赛实战之调参篇(完整流程)
这一篇博客的内容是在上一篇博客Scikit中的特征选择,XGboost进行回归预测,模型优化的实战的基础上进行调参优化的,所以在阅读本篇博客之前,请先移步看一下上一篇文章。我前面所做的工作基本都是关于特征选择的,这里我想写的是关于XGBoost参数调整的一些小经验。之前我在网站上也看到很多相关的内容,基本是翻译自一篇英文的博客,更坑的是很多文章步骤讲的不完整,新人看了很容易一头雾水。由于本人也是一个原创 2018-03-26 17:50:01 · 37874 阅读 · 15 评论 -
Kaggle比赛——Histopathologic Cancer Detection代码开源(Resnet50模型为基础)
Kaggle比赛 Histopathologic Cancer Detection 代码开源。 模型使用了Resnet50,修改最后几层网络结构重新训练,并且使用了五折交叉验证取平均值来提高精度。其中的一些trick在代码中已经标注。后面考虑修改网络结构,损失函数来进一步提高精度。更多比赛代码可查看我的github 大黄大黄大黄 。import osimport datetimeimpo...原创 2018-12-15 19:51:38 · 2954 阅读 · 2 评论 -
面向电信行业存量用户的智能套餐个性化匹配模型(top6)
1、赛题链接:面向电信行业存量用户的智能套餐个性化匹配模型2、赛题任务: 利用已有的用户属性(如个人基本信息、用户画像信息等)、终端属性(如终端品牌等)、业务属性、消费习惯及偏好匹配用户最合适的套餐,对用户进行推送,完成后续个性化服务。3、数据解读及预处理:多分类任务–>11分类;根据service_type来划分套餐 ,一类8个,另外一类3个(下文图片里面的大宝卡以及腾讯王卡系列...原创 2019-03-26 19:07:38 · 3393 阅读 · 0 评论 -
MaskRCNN-Benchmark(Pytorch版本)训练自己的数据以及避坑指南
一、安装首先要阅读官网说明的环境要求,千万不要一股脑直接安装,不然后面程序很有可能会报错!!!PyTorch 1.0 from a nightly release. It will not work with 1.0 nor 1.0.1. Installation instructions can be found in https://pytorch.org/get-started/lo...原创 2019-05-01 17:05:49 · 24763 阅读 · 50 评论