前言
嗨喽,大家好,这里是魔王~
你相信光吗(那年要不是我拿着手电筒照着电视机,迪迦奥特曼早就被打到了)
来自京东平台上的数据,万代奥特曼与万代高达以及乐高三大类型玩具的数据对比分析,消费者更爱哪一类?
那么,今天我们来分析一下,猛男的童年回忆:高达、乐高、奥特曼
代码部分
一次性导入所需要的全部第三方库
import pandas as pd
import pyecharts.options as opts
from pyecharts.charts import *
from pyecharts.globals import ThemeType#设定主题
from pyecharts.commons.utils import JsCode
1. 读取数据,而这些数据,一般都是我们爬取到的商品数据,或者公司内的数据库里面的数据
df1 = pd.read_csv(r'京东-乐高.csv', engine='python', encoding='utf-8-sig')
df2 = pd.read_csv(r'6K高达.csv', engine='python', encoding='utf-8-sig')
df3 = pd.read_csv(r'6K奥特曼.csv', engine='python', encoding='utf-8-sig')
查看下数据
df1.head(1)
2. 数据处理
把表格统计到一起
df_all = pd.concat([df1,df2,df3])
df_all.info()
除去重复值
df_all.drop_duplicates(inplace=True)
删除不必要的列
df_all = df_all.drop(['商品SKU','商品链接','封面图链接','评论链接','店铺链接','页码','当前时间','页面网址'],axis=1