数据分析
ccszbd
这个作者很懒,什么都没留下…
展开
-
【数据分析】Kaggle项目之电影数据分析
项目背景:客户是一个电影制作的新公司,他们将制作一部新电影。客户想确保电影能够成功,从而使新公司立足市场。提出问题:电影类型是如何随着时间的推移发生变化的?Universal Pictures 和 Paramount Pictures之间的对比情况如何?改编电影和原创电影的对比情况如何?电影页面查看次数与评分次数的相关关系?理解数据:数据来源数据来源于Kaggle项目数据...原创 2019-06-28 15:15:35 · 3923 阅读 · 5 评论 -
【数据分析】Kaggle项目之共享单车数据分析(二)
数据分析逐项展示时段对租赁数量的影响workingday_df=Bike_data[Bike_data['workingday']==1]workingday_df=workingday_df.groupby(['hour'],as_index=True).agg({ 'casual':'mean','registered':'mean','count':'mean'})nwor...原创 2019-07-10 11:04:42 · 2740 阅读 · 0 评论 -
【数据分析】Kaggle项目之共享单车数据分析(三)
选择特征值根据前面的观察,决定将时段、温度、湿度、年份、月份、季节、天气等级、风速、星期几、是否工作日、是否假日11项作为特征值由于CART决策树使用二分类,所以讲多类别型数据使用one-hot转化为二分类类型dummies_month=pd.get_dummies(Bike_data['month'],prefix='month')dummies_season=pd.get_dummie...原创 2019-07-10 14:26:22 · 2487 阅读 · 0 评论 -
【数据分析】Kaggle项目之共享单车数据分析(一)
项目背景自行车共享系统是一种租赁自行车的方法,注册会员、租车、还车都将通过城市中的站点网络自动完成,通过这个系统人们可以根据需要从一个地方租赁一辆自行车然后骑到自己的目的地归还。需要结合历史天气数据下的使用模式,来预测华盛顿共享自行车的租赁需求数据提供了跨越两年的每小时租赁数据,包含天气信息和日期信息,训练集由每月前19天的数据组成,测试集是每月第二十天到月底的数据提出问题通过测试集中...原创 2019-07-05 09:39:03 · 9711 阅读 · 0 评论