这两天无聊 分析抖音带货主播的货盘数据,但是飞瓜的有数据有点离散,想着整合处理一下,所以这篇主要记录一下这个处理脚本啦
原始数据太丑了,没有我要的指标
#数据切箱
datetime='621-627/'
#datetime = ['524-530/','531-606/','607-613','614-620/']
data_all = []
b=0
#for i in datetime:
inputPath = 'D:/直播数据分析/'+datetime
for input_file in glob.glob(os.path.join(inputPath,'*.xls')):
#a=pd.read_excel(input_file)
a=input_file
a=a.replace('\\','/')
print(a)
df = pd.read_excel(a)
df.drop(['商品链接','讲解时长','上架时间','下架时间','商品品牌'],axis=1,inplace=True)
df.drop(df[df['转化率']=='--'].index,inplace=True)
df.drop(df[df['销量']=='--'].index,inplace=True)
df.drop(df[df['销售额']=='--'].index,inplace=True)
m=[]
for i in df.转化率 :
i=i.replace('%','')
# print(i)
m.append(i)
df['转化率']=m
df['转化率']=df['转化率'].astype('float64')/100
df['销量']=df['销量'].astype('int')
df['销量贡献']=df['销量']/df['销量'].sum()
df['销售额']=df['销售额'].astype('float32').apply(lambda x : round(x,2