import pandas as pd
import numpy as np
#读取excel数据
df=pd.read_excel(“data/朝阳区药品销售数据.xlsx”)
print(df)
df.rename(columns={“购药时间”:“销售时间”},inplace=True)#对列重新命名
#print(df.info())
print(df)
#购药时间是字符串类型的日期格式,转换为时间类型格式datetime
from datetime import datetime
#print(datetime(2018,10,10))
#data 年月日 time 时分秒 timestamp 时间戳
df[‘销售时间’]=pd.to_datetime(df[‘销售时间’])
print(df)
#去掉空值,销售时间列升序排列
df.dropna(inplace=True)
df.sort_values(by=‘销售时间’,inplace=True)
print(df)
#提取购药时间,提取2018.4数据,构DataFrameindex
df.set_index(keys=‘销售时间’,inplace=True)
print(df.index)
data=df[‘2018’]
print(data[‘实收金额’].sum().round(2))#2
#自己构建5个DatatimeIndex,10D10天
#index1=pd.date_range(start=‘2010-1-1’,periods=5,freq=‘10D’)
#print(index1)