对现有数据清洗:
基本信息
1.表名:user
2.字段:
user_id:用户ID
item_id:商品ID
behavior_type:行为类型,其中1:pv,2:fav,3:cart,4:buy
item_category:商品类别
date:日期
time:时间
#查询数据是否导入成功
SELECT
*
FROM
USER
#查询数据是否存在缺失值
SELECT
count( * ),
count( user_id ),
count( item_id ),
count( behavior ),
count( item_category ),
count( date ),
count( time )
FROM
USER
#查询是否存在重复值
SELECT
*
FROM
USER
GROUP BY
user_id,
item_id,
behavior,
item_category,
date,