- 博客(3)
- 收藏
- 关注
原创 淘宝用户行为分析报告
淘宝用户的行为分析数据介绍PV和UV的分布情况日期维度(频率为天)可视化数据分析日期维度三级目录 数据介绍 本次数据为淘宝一个月的数据。该数据已进行脱敏处理。总数据量为1200万条,包含的字段如下: user_id item_id behavior_type user_geohash item_category time 0 98047837 232431562 1 NaN 4245 2014-12-06 02 1 97726136 383583590 1 NaN 5894 2014-12-09 20 2
2020-08-15 15:38:36 1304
原创 Airbnb短租
天池比赛:Airbnb短租项目(上) 项目介绍 下面的图片是,需要用到的数据集。数据集中包含的数据是特别丰富的。正如官网上所言,能从多个维度进行探索,这就见仁见智了。 了解数据 导入数据 数据量最大的要数calendar_detail,里面包含一千万条数据,内容是每个房屋每天情况。其次是listings_detail和listings更多的是用户的评价,其他的数据这里就不介绍了。 import pandas as pd import numpy as np path1='/home/jhon/Deskto
2020-08-09 17:30:08 393
原创 二手车价格预测
二手车价格预测查看比赛要求查看原始数据导入数据查看数据日期格式转化是否存在空值特征工程使用天数数据分箱选择特征字段处理测试数据特别注意构建模型模块导入数据预处理模型搭建Lasso模型Ridge模型BayesianRidge模型ExtraTreesRegressor模型XGBRegressor模型运行结果模型融合数据准备最终模型最终结果提交结果总结 查看比赛要求 下面是官网上的内容,原始数据很简单,都把数据给整理好了。只有三个数据,一个训练数据,一个测试数据,以及最后以什么格式提交的样本格式数据。 要求是很明
2020-08-07 17:00:36 3450 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人