自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 论坛 (1)

原创 你了解你的数据吗(元婴篇)

0x00 前言 本篇是《你了解你的数据吗》的第五篇,在前面的几篇文章中,我们聊到了数据接入量、数据的坑、数据核心维度分布、数据口径和数据质量监控。本篇将引入一个新的概念:数据血缘分析 ,或者叫血统分析。 0x01 血缘分析 那么什么是数据血缘分析呢?在这里我们不给出它的严谨的定义,仅从感觉上来解释一下这个东西。 数据血缘,我们可以大致理解为是一个表的生成过程。它依赖了哪些表,

2018-01-28 17:31:25 844

原创 你了解你的数据吗(结丹篇)

0x00 前言 结丹篇是《你了解你的数据吗》第四篇,本篇主要聊的内容主要和数据质量监控有关,之前在《数据质量监控》专门分享过相关内容,那篇文章主要从一个宏观的整体来看待质量监控,内容包括架构、设计和实现多个方面,但是对于数据质量监控本身的内容并没有一个比较体系化的梳理,本篇就来做这件事。 0x01 数据质量监控 我们将要分享的数据质量监控,不是单指数据异常,而是对数据各个角度的描述。

2018-01-21 14:04:07 761

原创 你了解你的数据吗(筑基篇)

0x00 前言 刚入行做数据开发的时候经常听企业导师讲,你要有数据的意识,不能只知道闷着头来一个需求接一个,要从业务的角度来理解数据,这样你的职业线才能更长。 本篇不会分享和业务强相关的数据 Sense,但是会引入一些各种业务都会涉及的最基本内容: 数据核心维度分布:核心业务维度分布,主要是指像年龄、地域、性别之类的维度分布。 数据口径:数据口径可以理解为同名字段在不同表中的取值范

2018-01-21 14:03:42 717

原创 No.28 你了解你的数据吗(练气篇)

0x00 前言 数据一道,可深可浅,可大可小。同为数据人,新手和老鸟亦有很大差别。本篇是了解数据的入门篇,包含两部门内容: 数据接入,你的掌控力如何?主要聊一聊数据接入人员对自己接入数据的了解的程度。 数据的坑,你总结了多少规律?在数据接入和基本的数据处理中,会遇到很多数据异常,这些异常你是否已经总结出了规律并纳入到了自己的知识体系。 0x01 数据接入量,你知道多少? 如果你

2018-01-13 19:39:18 666

空空如也

木东居士的留言板

发表于 2020-01-02 最后回复 2020-01-02

空空如也
提示
确定要删除当前文章?
取消 删除