plt.figure(figsize=(40,20),dpi=80)
font={
“family”:“kaiti”,
“size”:‘30’
}
plt.rc(“font”,**font)
plt.subplot(211)#在第一个位置日平均流量图
plt.plot(pv_daily[‘date’],pv_daily[‘pv_daily’],‘co-’)
plt.gca().xaxis.set_major_formatter(mdates.DateFormatter(‘%m/%d’))
plt.gca().xaxis.set_major_locator(mdates.DayLocator()) # 按月显示,按日显示的话,将MonthLocator()改成DayLocator()
plt.gcf().autofmt_xdate()
ax=plt.gca()
ax.spines[“top”].set_color(“w”)
ax.spines[“bottom”].set_color(“r”)
ax.spines[“left”].set_color(“r”)
ax.spines[“right”].set_color(“w”)
plt.gcf().autofmt_xdate()
#设置X轴标签
plt.xlabel(“时间”)
#设置y轴标签
plt.ylabel(“日平均流量统计图”)
plt.title(‘日平均流量’)
plt.figure(figsize=(40,20), dpi=80)
plt.subplot(212)#第二个位置绘制日平均独立访客数
plt.plot(pv_daily[‘date’],pv_daily[‘uv_daily’],‘yo-’)
plt.gca().xaxis.set_major_formatter(mdates.DateFormatter(‘%m/%d’))
plt.gca().xaxis.set_major_locator(mdates.DayLocator())
ax=plt.gca()
ax.spines[“top”].set_color(“w”)
ax.spines[“bottom”].set_color(“r”)
ax.spines[“left”].set_color(“r”)
ax.spines[“right”].set_color(“w”)
plt.title(‘日独立访问客流量’)
plt.gcf().autofmt_xdate()
#设置X轴标签
plt.xlabel(“时间”)
#设置y轴标签
plt.ylabel(“日独立访客量统计图”)
plt.show()
绘制子图,将日平均流量和独立访问客数放在一起进行对比分析:
-
-
可以发现在双十二当天是流量和独立访客数的高峰,在平常波动不大
每天时刻数据
每天的时刻数据
pv_daily_hour = data.groupby([‘hour’])[‘user_id’].count().reset_index().rename(columns={‘user_id’:‘pv’})
uv_daily_hour = data.groupby([‘hour’])[‘user_id’].apply(lambda x:x.drop_duplicates().count()).reset_index().rename(columns={‘user_id’:‘uv’})
pv_daily_hour.head()
uv_daily_hour.head()