导入所需的库
import pandas as pd
import numpy as np
import random
import sys
import time
from numpy import *
import jieba
#导入数据
a = pd.read_csv('sj2.csv')
a
#如图所示,要将销售额里的单位$去除
将符号去掉,并将CBD电和社区店的销售总额相加
b=a.iloc[:,2:]
b
#将符号去掉,并将CBD电和社区店的销售总额相加
a['销售额(万元)']=b['销售额(万元)'].apply(lambda x:x.split('$')[1])
a
#计算两店的销售总额
#计算CBD店的销售总额
a[a['销售点类型']=='CBD店']['销售额(万元)'].apply(lambda x:float(x)).sum()
#输出为4985.5
#计算社区店的销售总额
a[a['销售点类型']=='社区店']['销售额(万元)'].apply(lambda x:float(x)).sum()
#输出为4606.5
两个店分别的销售总额的柱形图
#输入中文字体
from pylab import *
mpl.rcParams['font.sans-serif'] = ['SimHei'] # 添加中文字体的名称
## #销售点销售额柱形图
import matplotlib.pyplot as plt
data = pd.Series([4985.5,4606.5], index=['CBD店','社区店'],)
plt.figure(figsize=(7,5))
plt.bar(['CBD店','社区店'],data)
plt.xticks(['CBD店','社区店'])
plt.title('CBD店和社区店销售总额情况 单位(万元)')
plt.show()
不同商品在CBD店和社区店内的销售额对比状况
#取CBD店的,算总额
c = a[a['销售点类型']=='CBD店'