16_分析共享单车日活跃用户

在这里插入图片描述


博文配套视频课程:24小时实现从零到AI人工智能


日期进行采样操作

时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测

import pandas as pd
import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']
data = pd.read_csv("../data/bike.csv")
# 首先把datetime转化为日期类型
data['datetime'] = pd.to_datetime(data['datetime'])
data.info()
# 把时间序列设置为索引
data.set_index('datetime',inplace=True)
print(data.head(n=3))
print('-'*20,'对日期的采样,统计每天的骑行数据','-'*20)
d_bike = data.resample('d')['count'].mean()
print(d_bike,type(d_bike))
# 先创建新的day,hour
data['day'] = data.index.day
data['hour'] = data.index.hour
print(data,type(data))

分组统计每小时的骑行记录

print('通过分组统计每小时的骑行记录')
h_bike = data.groupby(by='hour')['count'].sum()
print(h_bike,type(h_bike))
# 采用线性图,查看每小时的骑行数据
plt.plot(h_bike.index,h_bike.values,'r--*')
# 自定义刻度坐标值
plt.xticks(range(h_bike.size),[i+1 for i in range(h_bike.size)])
plt.savefig('./h_bike.jpg')
plt.show()

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值