背景:每日从分行提取数据,进行汇总和计算。这个步骤在excel操作大概需要花20分钟,不过写好代码,一秒即可得出结果。
整理这份代码,主要是以这背景为案列,记录pandas和numpy的一些基本操作。
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
daily=pd.read_csv(r' ',encoding='utf-8')#读取csv文件数据
#将金额转成万
daily['放款金额']=daily['放款金额']/10000
#筛选时间范围,只需要近一个月的汇总数据
day_31='2018-01-03'
daily=daily[daily['申请日期']>day_31]
#创建list新的列名
days=[]
for i in np.arange(31):
d='D'+str(i)+'处理百分比'
days.append(d)
#将处理百分比转化成处理单数
for i in np.arange(31):
D=pd.DataFrame(daily[days[i]]*daily['申请单数'])
daily.insert(int(i),str(i),D)
#将D处理单数求和
v1=['申请单数']
for i in np.arange(31):
v2=str(i)
v1.append(v2)
precent_pivot=pd.pivot_table(daily,index=['申请日期'],values=v1,aggfunc=sum)#excel数据透视表功能
#