设淘宝用户行为推荐(二):特征工程

在这里插入图片描述


# coding: utf-8

# In[1]:


import pandas as ps
import seaborn as sns
sns.set(font='SimHei')  # 解决Seaborn中文显示问题


# In[2]:


data=ps.read_csv('UserBehavior.csv',header=None,names=['用户ID','商品ID','商品类别ID','行为类型','时间戳'])


# In[3]:


data.head()


# In[4]:


#查看数据集大小
data.shape


# In[5]:


#查看特征对应的数据类型
data.dtypes


# In[6]:


#查看数据是否有缺失值
data.isnull().sum()


# In[7]:


#查看特征的详细信息,方便对数据集有一个直观的印象
data.describe(include='all')


# In[8]:


#查看数据集信息
data.info()


# In[9]:


#查看分类型特征中有哪些分类,以'行为类型'举例
print('行为类型',data['行为类型'].unique())


# In[10]:


#查看行为类型分布
sns.countplot(x='行为类型',data=data)


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值