案例:探究用户对物品类别的喜好细分降维
案例介绍
数据介绍
思路
探究【用户】【user_id】和【物品类别】【aisle】之间的关系
小问题
步骤
1)需要将user_id和aisle放在同一个表中–》合并
2)找到user_id和aisle之间的关系–》交叉表和透视表
3)特征冗余过多–》PCA降维
解
import pandas as pd
from sklearn.decomposition import PCA
# 1.获取数据
products=pd.read_csv("../data/instacart/products.csv")
aisles=pd.read_csv("../data/instacart/aisles.csv")
orders=pd.read_csv("../data/instacart/orders.csv")
order_products__prior=pd.read_csv("../data/instacart/order_products__prior.csv")
下面是我的文件结构
<class 'pandas.core.frame.DataFrame'>
Int64Index: 32434489 entries, 0 to 32434488
Data columns (total 14 columns):
# Column Dtype
--- ------ -----
0 aisle_id int64
1 aisle object
2 product_id int64
3 product_name object
4 department_id int64
5 order_id int64
6 add_to_cart_order int64
7 reordered int64
8 user_id int64
9 eval_set object
10 order_number int64
11 order_dow int64
12 orde