自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 数据的清洗

数据分析师80%的时间都花在数据清洗上!好的数据质量,应该满足“完全合一”• 完整性:数据是否存在空值,字段是否完善,是否有漏掉• 全面性:观察某一列的全部数值及特征值,是否存在单位、字段 名与数值不匹配• 合法性:数据的类型、内容、大小的合法性。• 唯一性:数据是否存在重复记录问题1:缺失值在数据中有些年龄、体重数值是缺失的,这往往是因为数据量较大,在过程中,有些数值没有采集 到。通常我们可以采用以下三种方法:• 删除:删除数据缺失的记录;• 均值:使用当前列的均值

2022-03-15 11:19:58 2966

原创 用户画像与标签推荐

三个问题:都是谁、从哪来、到哪去三个步骤:统一标识、打上标签、指导业务三个阶段:获客、粘客、留客三个层次:数据层、算法层、业务层八字原则:用户消费行为分析

2022-03-15 10:58:10 315

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除