自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 数据的清洗

数据分析师80%的时间都花在数据清洗上! 好的数据质量,应该满足“完全合一” • 完整性:数据是否存在空值,字段是否完善,是否有漏掉 • 全面性:观察某一列的全部数值及特征值,是否存在单位、字段 名与数值不匹配 • 合法性:数据的类型、内容、大小的合法性。 • 唯一性:数据是否存在重复记录 问题1:缺失值 在数据中有些年龄、体重数值是缺失的,这往往是因为数据量较大,在过程中,有些数值没有采集 到。通常我们可以采用以下三种方法: • 删除:删除数据缺失的记录; • 均值:使用当前列的均值

2022-03-15 11:19:58 2965

原创 用户画像与标签推荐

三个问题:都是谁、从哪来、到哪去 三个步骤:统一标识、打上标签、指导业务 三个阶段:获客、粘客、留客 三个层次:数据层、算法层、业务层 八字原则:用户消费行为分析

2022-03-15 10:58:10 315

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除