共享单车数据爬取_共享单车数据分析-python

本文通过获取和清洗Pronto在西雅图的共享单车数据,进行数据可视化分析。发现会员租车人数多于非会员,男性用户多于女性,30-40岁用户占比最高。租车数量受时间影响显著,早晚高峰与工作日需求较高,温度、湿度、能见度和风速也影响租车需求。
摘要由CSDN通过智能技术生成

8a11485605181792bea74f80b819b1ae.png

目录

一、获取数据

二、理解数据

三、 数据清洗

四、数据可视化分析

一、获取数据

从kaggle下载数据集

Cycle Share Dataset​www.kaggle.com
9ea45a1fcea3b77f9e306f0a6e9b62ce.png

此数据是Pronto在西雅图运营的500辆共享单车数据(2014-2016年),提供了包括租车信息、共享单车信息以及每日天气数据。

二、理解数据

1.导入需要用到的工具包

import pandas as pd   # 导入数据框处理工具包

import datetime      # 导入处理时间工具包

import matplotlib.pyplot as plt       # 导入matplotlib工具包中绘图函数pyplot
%matplotlib inline
plt.style.use('ggplot') # 选择画图风格

import warnings         # 忽略警告提示
warnings.filterwarnings('ignore')

from pylab import mpl    
mpl.rcParams['font.sans-serif'] =['SimHei']    # 指定默认中文字体
mpl.rcParams['axes.unicode_minus'] = False    # 解决保存图像中负号‘-’显示为方块的问题

2.导入需要分析的数据

trip = pd.read_csv(r"C:UsersAdministratorDesktopkaggle datacycle-share-datasettrip.csv", encoding = 'utf8', sep = ',')
weather = pd.read_csv(r"C:UsersAdministratorDesktopkaggle datacycle-share-datasetweather.csv", encoding = 'utf8', sep = ',')

数据存储格式为CSV文件,用记事本方式打开数据集并设置为中文编码(utf8),为后期分析中文数据集打下良好基础。

3.查看数据集信息

对数据集进行概览,查看字段数据类型及缺失值情况,如存在缺失值,后期应对缺失值加以处理再进行分析问题。

1d8be4c949744e66080905dce91622ba.png

6c60a25245584b4e04a74665ba330f60.png

66367932f0ca89ccf63f8f57c58b52ac.png

efb6f0c44f640190f3ec1e46089449ce.png

ce6149f3f5a250ec0addb0e8f3cb9de9.png

4.删除冗余字段

通过对数据集的概览,删除冗余字段并重命名重要字段,减少内存的占用,加快数据处理速度,增加数据的可读性。

fcfbb9d06c8f61619ef8fbf8a07fc619.png
weather.drop(['Max_Temperature_F','Min_TemperatureF',
              'Max_Dew_Point_F','Min_Dewpoint_F',
              'Max_Humidity','Min_Humidity',
              'Max_Sea_Level_Pressure_In','Min_Sea_Level_Pressure_In',
              'Max_Visibility_Miles','Min_Visibility_Miles',
             'Max_Wind_Speed_MPH','Max_Gust_Speed_MPH','Events'],axis = 1,inplace 
  • 2
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值