中秋节马上就要到了~
最近也在张罗着买月饼~
但是现在月饼这么多,真的不知道要选哪家划算了…
所以用python来给月饼数据做个可视化,来好好准备一下~
数据
数据集、源码、解答加Q君羊: 点击蓝字加入【python学习qun】
代 码🥮
# 导包
import pandas as pd
import numpy as np
import re
# author:Dragon少年
# 导入爬取得到的数据
df = pd.read_csv("月饼.csv", encoding='utf-8-sig', header=None)
df.columns = ["商品名", "价格", "购买人数", "店铺", "地址"]
# 去除重复的数据
df.drop_duplicates(inplace=True)
print(df.shape)
# 删除购买人数0的记录
df['购买人数'] = df['购买人数'].replace(np.nan,'0人付款')
df['num'] = [re.findall(r'(\d+\.{0,1}\d*)', i)[0] for i in df['购买人数']] # 提取数值
df['num'] = df['num'].astype('float') # 转化数值型
# 提取单位(万)
df['unit'] = [''.join(re.findall(r'(万)', i)) for i in df['购买人数']] # 提取单位(万)
df['unit'] = df['unit'].apply(lambda x:10000 if x=='万' else 1)
# 计算销量
df['销量'] = df['num'] *