- 博客(2)
- 收藏
- 关注
原创 数据的清洗
数据分析师80%的时间都花在数据清洗上!好的数据质量,应该满足“完全合一”• 完整性:数据是否存在空值,字段是否完善,是否有漏掉• 全面性:观察某一列的全部数值及特征值,是否存在单位、字段 名与数值不匹配• 合法性:数据的类型、内容、大小的合法性。• 唯一性:数据是否存在重复记录问题1:缺失值在数据中有些年龄、体重数值是缺失的,这往往是因为数据量较大,在过程中,有些数值没有采集 到。通常我们可以采用以下三种方法:• 删除:删除数据缺失的记录;• 均值:使用当前列的均值
2022-03-15 11:19:58 2980
原创 用户画像与标签推荐
三个问题:都是谁、从哪来、到哪去三个步骤:统一标识、打上标签、指导业务三个阶段:获客、粘客、留客三个层次:数据层、算法层、业务层八字原则:用户消费行为分析
2022-03-15 10:58:10 320
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人