现有数据如下格式:
我们需要根据日期统计日点击量,画出日点击量图
# -*- coding: utf-8 -*-
"""
Created on Thu Nov 7 18:39:18 2019
@author: 1
"""
import pandas as pd
from matplotlib import pyplot as plt
df=pd.read_excel('test.xls',header=None)
df.columns=['公司','时间','地点','学校','地点','点击量']
df['time']=df['时间'].str.extract(r'(\d+年\d+月\d+日)', expand=False)
df_new=df.iloc[:,[5,6]]
df_sum=df_new['点击量'].groupby(df_new['time']).sum()
plt.figure(1)
df_sum.plot(kind='bar')
plt.xlabel('日期')
plt.ylabel('点击量')
df.groupby会生成GroupBy的对象,可以调用mean(), count(), sum()等方法产生一个Series,其中索引为‘id’中的唯一值,去除重复值。格式:df.groupby(df[‘含重复值的列’]).计算函数()
上述python代码得出结果如下: