# coding: utf-8
# In[1]:
import pandas as ps
import seaborn as sns
sns.set(font='SimHei') # 解决Seaborn中文显示问题
# In[2]:
data=ps.read_csv('UserBehavior.csv',header=None,names=['用户ID','商品ID','商品类别ID','行为类型','时间戳'])
# In[3]:
data.head()
# In[4]:
#查看数据集大小
data.shape
# In[5]:
#查看特征对应的数据类型
data.dtypes
# In[6]:
#查看数据是否有缺失值
data.isnull().sum()
# In[7]:
#查看特征的详细信息,方便对数据集有一个直观的印象
data.describe(include='all')
# In[8]:
#查看数据集信息
data.info()
# In[9]:
#查看分类型特征中有哪些分类,以'行为类型'举例
print('行为类型',data['行为类型'].unique())
# In[10]:
#查看行为类型分布
sns.countplot(x='行为类型',data=data)
设淘宝用户行为推荐(二):特征工程
最新推荐文章于 2024-07-24 19:29:36 发布