分析目标
根据现有数据对消费者进行用户画像的构建,从物理属性和行为属性两个方面进行分析,如下图所示。
导入库
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
读取数据并初步处理
df_raw = pd.read_csv('BlackFriday.csv')
df_raw.sample(5)
# 查看数据信息
df_raw.info()
Product_Category_2 和 Product_Category_3 两个字段存在缺失值。着重分析第一分类,故暂时不做处理。
# 查看岗位编码的数据有哪几种
df_raw['Occupation'].unique()
职业应该是文本类型,所以对上面查询到岗位编码,修改数据
如果有对应的岗位对照表,就可以直接取,本次使用模拟的对照表。
df_raw['Occupation'] = df_raw['Occupation'].replace({
0:'医生',
1:'警察',
2:'律师',
3:'人力',
4:'程序员',
5:'运营',
6:'产品',
7:'项目管理',
8:'金融',
9:'服装设计',
10:'老师',
11:'教授',
12:'行政',
13:'公务员',
14:'物流',
15:'餐饮',
16:'零售',
17:'农业',
18:'广告',
19: