针对前三天学习到的爬取下来的数据,进行分析,然后可视化展示。
import openpyxl
import matplotlib.pyplot as plt
wk=openpyxl.load_workbook('data/0001子-18056567072.xlsx')#刚刚保存到Excel中的数据
sheet = wk['Sheet1']
colors=[]
sizes=[]
for i in range(1,11): #针对Excel中的数据分析那个颜色的鞋子的销量是最高的
colors.append(sheet['A'+str(i)].value)
sizes.append(sheet['B' + str(i)].value)
colors_class=set(colors)
count=len(colors)
color_percent=[]
for clr in colors_class:
color_percent.append(colors.count(clr)/count)
plt.pie(x=color_percent,labels=colors_class,autopct='%1.1f%%')
plt.rcParams['font.sans-serif']=['SimHei']
plt.legend()
plt.savefig('data/0001子-18056567072.png')#分析结果以一张图片的形式保存在云服务器上
改成pycharm上。
import openpyxl
import matplotlib.pyplot as plt
wk=openpyxl.load_workbook('D:\soft\datalook\data.xlsx')#刚刚保存到Excel中的数据
sheet = wk['Sheet1']
colors=[]
sizes=[]
for i in range(1,11): #针对Excel中的数据分析那个颜色的鞋子的销量是最高的
colors.append(sheet['A'+str(i)].value)
sizes.append(sheet['B' + str(i)].value)
colors_class=set(colors)
count=len(colors)
color_percent=[]
for clr in colors_class:
color_percent.append(colors.count(clr)/count)
plt.pie(x=color_percent,labels=colors_class,autopct='%1.1f%%')
plt.rcParams['font.sans-serif']=['SimHei']
plt.legend()
plt.savefig('D:\soft\datalook\data.png')#分析结果以一张图片的形式保存在云服务器上