17-instacart降维案例

该博客通过分析Instacart的数据,探讨了用户对不同物品类别的购买偏好。首先介绍了案例背景和数据详情,然后提出了通过合并数据、创建交叉表和使用PCA进行降维来找出用户ID与物品类别之间的关系。降维后,数据的特征冗余得到减少,便于进一步的分析。
摘要由CSDN通过智能技术生成

案例:探究用户对物品类别的喜好细分降维

案例介绍

在这里插入图片描述

数据介绍

在这里插入图片描述

思路

探究【用户】【user_id】和【物品类别】【aisle】之间的关系

小问题

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

步骤

1)需要将user_id和aisle放在同一个表中–》合并

2)找到user_id和aisle之间的关系–》交叉表和透视表

3)特征冗余过多–》PCA降维

在这里插入图片描述

import pandas as pd
from sklearn.decomposition import PCA
# 1.获取数据
products=pd.read_csv("../data/instacart/products.csv")
aisles=pd.read_csv("../data/instacart/aisles.csv")
orders=pd.read_csv("../data/instacart/orders.csv")
order_products__prior=pd.read_csv("../data/instacart/order_products__prior.csv")

下面是我的文件结构

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

<class 'pandas.core.frame.DataFrame'>
Int64Index: 32434489 entries, 0 to 32434488
Data columns (total 14 columns):
 #   Column                  Dtype  
---  ------                  -----  
 0   aisle_id                int64  
 1   aisle                   object 
 2   product_id              int64  
 3   product_name            object 
 4   department_id           int64  
 5   order_id                int64  
 6   add_to_cart_order       int64  
 7   reordered               int64  
 8   user_id                 int64  
 9   eval_set                object 
 10  order_number            int64  
 11  order_dow               int64  
 12  orde
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值