这是来自《和鲸社区的一个》数据分析实战项目
原始链接为某电子产品销售数据分析报告及RFM模型
自己写的,用来练手
编辑器使用Vscode
这一部分是产品分析
from logging import handlers
from matplotlib.pyplot import colorbar, figure, twinx
import pandas as pd
import numpy as np
import matplotlib
import matplotlib.pylab as plt
from datetime import datetime
import data_user_proces
from pandas.core import groupby
#产品分析
#显示所有列
pd.set_option('display.max_columns', None)
#显示所有行
pd.set_option('display.max_rows', None)
#定义plt,绘图字体
matplotlib.rc("font",family='SimHei')
datapath=r'C:\Users\26053\Desktop\论文\Python\project_vscode\data_clean.csv'
data=pd.read_csv(datapath,index_col=0)
print(data.head())
#各省销量,销售额情况
sale_prices=data.groupby('local').agg({
'buy_cnt':'sum','price_cnt':'sum'}).sort_values('price_cnt',ascending=True)
sale_prices['price_cnt']=sale_prices['price_cnt'].astype('int')
print(sale_prices)
plt.figure(num=1,figsize=(16,8))
plt.barh(sale_prices.index,sale_prices['price_cnt'])
for i,j in enumerate(sale_prices['price_cnt']):
plt.text(x=j+200,y=sale_prices.index[i],s=j)
plt.title('各省销售额情况')
plt.figure(num=2,figsize=(16,8))
plt.barh(sale_prices.index,sale_prices['buy_cnt'])
for i,j in enumerate(sale_prices['buy_cnt']):
plt.text(x=j+200,y=sale_prices.index[i],s=j)
plt.title('各省销量情况')
#按日期分析销售额与销量的总体走势
date_sales=data.groupby('date').agg(销量=('buy_cnt','sum'),销售额=('price_cnt','sum'))
date_sales.index=pd.to_datetime(date_sales.index)
print(date_sales.head())
#销售额随着日期的变化
plt.figure(num=3,figsize=(16,8))
plt.plot(date_sales.index,date_sales['销售额'])
plt.xlabel('日期')
plt.ylabel('销售额')
plt.title('销售额随着时间的变化')
#销量随着日期的变化
plt.figure(num=4,figsize=(16,8))
plt.plot(date_sales.index,date_sales['销量'