前言
嗨喽~大家好呀,这里是魔王呐 !
中秋节,又称拜月节、月光诞、月夕等,节期在每年的农历八月十五日(九月十)。
中秋节自古以来就有祭月、赏月、吃月饼、玩花灯、赏桂花、饮桂花酒等民俗,流传经久不息。
马上有临近中秋,这不得好好准备~于是准备对月饼数据进行可视乎
数据
数据集、源码、解答加Q君羊:926207505 点击蓝字加入【python学习裙】
代码
# 导包
import pandas as pd
import numpy as np
import re
# author:Dragon少年
# 导入爬取得到的数据
df = pd.read_csv("月饼.csv", encoding='utf-8-sig', header=None)
df.columns = ["商品名", "价格", "购买人数", "店铺", "地址"]
# 去除重复的数据
df.drop_duplicates(inplace=True)
print(df.shape)
# 删除购买人数0的记录
df['购买人数'] = df['购买人数'].replace(np.nan,'0人付款')
df['num'] = [re.findall(r'(\d+\.{0,1}\d*)', i)[0] for i in df['购买人数']] # 提取数值
df['num'] = df['num'].astype('float') # 转化数值型
# 提取单位(万)
df['unit'] = [''.join(re.findall(r'(万)', i)) for i in df