自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(599)
  • 论坛 (1)
  • 收藏
  • 关注

原创 数据仓库实践之业务数据矩阵的设计

怀疑有如草木之芽,从真理之根萌生...0x00 概述数据仓库的设计不能完全依赖于业务的需求,但又必须服务于业务的价值。那么,该如何地从业务的角度出发,设计一套切实可行的数据仓库呢?本文将分享数据仓库实践中的业务数据矩阵的设计经验,帮助大家在工作中快速理解业务并规划数据仓库体系。本文将包含如下三部分内容:分享业务数据仓库的概念的作用 举个栗子说明 一些思考0x01 业务...

2019-01-01 11:40:52 2689 1

原创 漫谈数据仓库和范式

0x00 概述长期从事数据仓库的你,是否还记得数据库设计中的三大范式?在设计数据仓库的表时,是否考虑过规范化和反规范化之间的区别?是否想过数据仓库和数据库在设计中对范式考虑的侧重点是什么?本文,将包含如下几个方面: 一起回顾数据库设计中经典的三大范式 聊一聊数据仓库和范式之间的关系 聊一聊数据仓库和数据库在范式设计中的侧重点 全文将会围绕一个订单表(假设一个订...

2018-12-27 17:33:29 1449

原创 一种通用的数据仓库分层方法

0x00 概述数据分层是数据仓库设计中十分重要的一个环节,优秀的分层设计能够让整个数据体系更易理解和使用。而目前网络中大部分可以被检索到相关文章只是简单地提及数据分层的设计,或缺少明确而详细的说明,或缺少可落地实施的方案,或缺少具体的示例说明。因此,本文将指出一种通用的数据仓库分层方法,具体包含如下内容: 介绍数据分层的作用 提出一种通用的数据分层设计,以及分层设计的原则...

2018-12-27 17:31:21 4444 7

转载 Pandas数据分析实战最强学习手册(附源数据代码)

大家好,我是木东居士~用Python做数据分析,绕不开的就是Pandas库,这个库实在是太NB了!只是Pandas相关学习资料很多,坑也非常之多。不少同学在啃完一些书后,觉得自己什么都懂...

2021-01-19 12:00:00 2

转载 【木东在读】用户增长的这个坑,你还在躺里面吗?

木东居士数据从业者接着上一篇用户增长的文章《【木东在读】一张图阐述用户增长全链路技术图谱》,今天再分享一篇大佬写的好文。从居士的角度来理解,做增长,本质上还是要为用户提供有价值的东西,而...

2021-01-18 23:22:50 9

转载 数据分析师为什么要懂商业思维?

2020年,除了“直播带货” “私域流量池”“线上线下结合”等热门词语,其中不常被提起、却至关重要的就是“数字营销”了。以众所周知的星巴克“猫爪杯”为例,一经推出就火遍全网,在这款产...

2021-01-15 08:27:00 22

转载 【木东在读】终于有人把标签设计讲明白了

木东居士数据从业者又是因为一张图转载的一篇文章,关于标签的分类,可以直接参考本文的划分。在做标签的时候,首先要提的一般是用户画像,而用户画像一般是由两部分组成的:标签和特征,很多小伙伴在...

2021-01-14 07:47:00 25

转载 整理分享!数据分析面试经验+必读书籍+简历模版

你们好,我是居士!最近有很多的小伙伴问我说了解一些Python、SQL,想转行数据分析,如何去准备?对于这个问题,我想好友宝器的文章和整理的干货能给大家一些帮助。可能很多老读者应该都关注...

2021-01-12 12:00:00 6

转载 【木东在读】一张图阐述用户增长全链路技术图谱

木东居士数据从业者用户增长一直是一个比较热门的话题,特别在互联网行业,大多数数据分析团队都会接触和增长相关的业务场景。而在用户增长领域里面,最常见的应该当属于AAARR模型,AARRR是...

2021-01-11 22:16:55 12

转载 统计中存在的悖论

我们的大脑的确不能很好地处理概率问题,所以对错误的出现我并不感到惊讶。——统计学家 戴康尼斯引言正如上面统计学家所说,人类不善于处理概率问题,以至于有时候用概率解释问题的答案,超乎人的想...

2021-01-10 21:22:48 7

转载 如何用DBSCAN聚类模型做数据分析?

DBSCAN属于无监督学习算法,无监督算法的内涵是观察无标签数据集自动发现隐藏结构和层次,在无标签数据中寻找隐藏规律。聚类模型在数据分析当中的应用:既可以作为一个单独过程,用于寻找数据内...

2021-01-10 21:22:48 20

转载 如何用聚类模型(k-means)做数据分析?

k-means属于无监督学习算法,无监督算法的内涵是观察无标签数据集自动发现隐藏结构和层次,在无标签数据中寻找隐藏规律。聚类模型在数据分析当中的应用:既可以作为一个单独过程,用于寻找数...

2021-01-10 21:22:48 23

转载 手把手演示如何规划一个企业级数据中台

木东居士非著名数据从业者“什么是数据中台?”这个问题在2020年初还有很多小伙伴经常在群里询问,然而还没到21年,就传出来了阿里要去中台化的消息,颇有一种刚上车,车就要坏了的感觉。那么...

2021-01-07 08:06:00 15

转载 用户分层,该怎么分才合理(实操版)

本文读完需要很认真,请追求进步的你坚持阅读到最后,并且点个在看证明你读完了【木东居士】在用户画像的建设中,很少有团队不提用户分层的,比如说你的活跃用户分层(高、中、低活跃用户)、付费用户...

2021-01-05 08:19:00 39

转载 为什么好的流程得不到贯彻?

【木东居士】想要在一个团队中快速高效的推进一件事情,有两种比较有效的途径:一为提升合作方之间的关系,通过人情提效;一为制定好相应的流程和规范,通过约束提效。前者虽好,但是具备高情商素质的...

2021-01-03 20:45:53 23

原创 关于2021的一些想法

昨天发了2020年的总结后,收到了不少朋友的反馈,有希望居士能坚持保持原创的,有希望居士多关注社群运营的,有吐槽居士原创变少了的,也有好奇居士后面有什么规划。因此,今天居士就聊一下21年...

2021-01-02 16:30:12 79

原创 聊一聊2020年的总结和思考

2020年,突然间就过去了,当我开始写这篇总结的时候,都感觉还没有适应今天已经是2021年的1月1号,脑子里面想到的最大的影响就是,以后数据表的时间分区就该变成20210101这种了,周...

2021-01-01 21:09:33 22

转载 面到阿里月薪 35k 数据PM岗,很难?

最近,我在后台看到有位同学问:身边几个朋友、同事都转岗做数据产品经理了,其中一个前同事,转行工作两年就全款买了房,羡慕得不得了!于是自己也想考虑转行,数据产品经理现在很吃香吗?我想回答这...

2020-12-28 12:35:41 42

转载 offer该怎么选:大公司or小公司?高薪or期权?

阅读本文大概需要3分钟。关于工作选择的话题,旧文也写过:如何判断好公司、怎么跳槽之类。最近到了秋招,不少读者问怎么选择offer的问题,回答的多了就想着再写一篇文章,希望对大家有帮助:第...

2020-12-27 23:42:56 27

转载 不懂归因,也许你广告还没入门

题目取得有点浮夸,主要是用于哗众取宠,为了避免冒犯读者,我首先得承认,我在广告行业确实也没入门。只是干了几年,有些想法要说说。归因的逻辑对于广告来说确实非常重要,如果你不认同,我也没打算...

2020-12-27 23:42:56 30

转载 基于业务计划和收益的数据资产价值评估研究

摘要本文阐释数据资产和数据资产价值评估的概念,分析和总结了数据资产价值评估的一般方法及其优缺点,经比较分析得出基于业务收益评估数据资产价值具有一定的可行性。本文提出了基于业务计划和收益的...

2020-12-25 09:00:00 89

转载 数据分析必看的oCPM/oCPC核心知识点

文章一共3500多字,读完预计需要30分钟,不过内容相对独立,有兴趣可以先收藏后查阅。OCPM 或者OCPC 能力在最近几年得到长足的发展,在广告行业中大放异彩,如果一个广告平台不支持...

2020-12-25 09:00:00 71

转载 广告平台和广告主是如何互相“窃取”数据的(上)

互联网广告经过多年的发展,在广告的生态中,广告平台和广告主的关系就像战争时敌我双方的关系,互相博弈,相互渗透。渗透的本质主要是获取信息。拥有大的用户基数的公司通常都会自建广告平台,这...

2020-12-23 21:49:00 65

转载 广告平台和广告主是如何互相“窃取”数据的(下)

渗透往往都是互相的,当敌人出现在你的狙击射程内的时候,切记,你也在敌人射程内。前文说到广告平台通过各种方式获取到广告主后端相关数据,主要用于优化广告模型,使得用户的定向和预估能力更加精...

2020-12-23 21:49:00 81

转载 系统思考数据质量

系统思考数据质量|0x00 质量标准体系在谈一件事情的质量时,我们通常会想起ISO的标准,例如ISO9000,如果一件商品被打上了ISO的标签,对于自己产品的质量,是一件最有说服力的证据...

2020-12-22 19:16:08 22

原创 数据质量监控

0x00 概述随着大数据时代的带来,数据的应用也日趋繁茂,越来越多的应用和服务都基于数据而建立,数据的重要性不言而喻。而且,数据质量是数据分析和数据挖掘结论有效性和准确性的基础,也是这一...

2020-12-22 19:16:08 69

转载 都快2021年了,居然还有数据分析师不会MECE

几乎所有数据分析的书、教程、文章,都很政治正确写上MECE作为数据分析的准则。这东西很快又成为一个数据领域的“咕咚来了”:到底啥是MECE为啥非得MECE我做的是不是MECE一大堆问号没...

2020-12-21 21:47:00 18

转载 【猫娘小可爱频道】闲聊+1

本篇是居士养的一只喵,看了一个视频后的观后感,视频已附在文章末尾,可点击小程序观看。欢迎大家讨论~喵喵看这个视频突然产生的一个想法,是比较有实感的感觉到了时间的美感或者四维时间轴对事物的...

2020-12-21 21:47:00 16

转载 写给所有想进入数据行业的朋友们

大家好,我是木东居士。作为数据人,如何在企业中找到自己的位置,做好职业规划?年轻的数据人已经在筹备这个问题,中年的数据人越来越有重重的危机感。在此,好友接地气的陈老师,十年的数据总监...

2020-12-20 23:09:23 14

原创 【好书推荐:第7期】精心挑选5本数据分析入门书

0x00 前言最近很多小伙伴都来问居士入门数据分析看什么书比较好,之前一直没有写文章来回答是因为还有一两本书没翻完,自己没好好看的书,居士不太愿意分享的。而,之前看到的很多别人的推荐书单...

2020-12-19 22:29:55 104 3

转载 判断领导是在压榨你,还是在培养你?就看这5点!别被骗了!

前文写了职场PUA的文章,有读者问洋哥:我的领导有点像PUA,但又总是说要培养我,怎么破?读者问的问题并不是个案,前不久一个哥们挺郁闷找我喝酒。酒过半巡,这哥们开始给我诉苦。大概是工作怎...

2020-12-17 08:30:00 35

转载 两篇文章带你深入理解A/B Testing(一)

导读:如果希望了解A/B Testing 实际应用的指标说明,可以直接读文章的第二部分。如果你希望了解一些理论基础,可以从这篇文章开始读。一、为什么要进行AB Testing:AB实验的...

2020-12-16 23:50:00 55

转载 两篇文章带你深入理解A/B Testing(二)

导读:这里是A/B Testing的第二篇文章,如果希望了解A/B Testing 实际应用的指标说明,可以只读当前文章这部分。如果你希望了解一些理论基础,可以先看第一篇。五、置信区间...

2020-12-16 23:50:00 27

转载 用户生命周期,这部分关键内容,书上忘了讲……

在做数据分析的时候,用户生命周期分析,是个很典型的“理论一听就懂,数据一做就废”的东西。很多同学很困扰:“到底生命周期该怎么算?为啥我算的套到业务上不成立!”今天我们系统解答一下。0...

2020-12-15 09:00:00 18

转载 不懂工作拆解你忙死算

工作时间碎片化已经成为职场人的常态,作为一个不是那么 top 的纯技术人员,你会经常被各种各样的人打断。老板突然说xxx你过来一下,跟你说个事。产品经理突然说 xxx 有个功能要跟你对一...

2020-12-14 23:39:14 31

转载 它是最给力的数据分析体系,却被90%的新人忽略!

日、周、月、季、年报制度,可能是数据分析领域最大的一个“咕咚来了”。每一个新人在进公司的时候,都会得到一个类似传家宝一样的日、周、月报模板,交接工作的前辈会告诉你:“对着模板更新它们,然...

2020-12-09 19:30:00 21

转载 我对120年的奥运数据进行了可视化分析,居然...

0x00 Tableau简介Tableau是一款定位于数据可视化敏捷开发和实现的商务智能展现工具,可用来实现交互的、可视化的分析和仪表盘应用。Tableau提供了体验感良好且易用的使用界...

2020-12-09 19:30:00 50

转载 数据分析不落地?典型案例教会你!

开局一张图数据从业者们经常会陷入这种窘境:一方面抱怨长期做底层的脏活儿累活儿,驱动业务的机会太少;一方面真到了要给业务献言献策的时候,又被吐槽分析出一堆已知事实没啥实际帮助很多文章都会选...

2020-12-02 08:33:00 42

转载 作为业务数据开发,我们为什么会焦虑?

作为业务数据开发,我们为什么会焦虑?|0x00 思维定势每个人都有自己的思维定势,自己的行为时时刻刻的受思维定势影响。很多人并不认为自己有思维定势,尤其是做数据的小伙伴们,我们通常倾向于...

2020-12-01 23:28:04 21

转载 如何开展企业数据资产评估

一目的由于数据本身的特性(非实体性、依托性、多样性、增值性、可加工性等),导致企业对数据资产的评估难度很大,同时由于数据资产所产生的经济效益具有不确定性,即使相同的数据面对不同的业务场景...

2020-11-29 23:49:33 46

空空如也

木东居士的留言板

发表于 2020-01-02 最后回复 2020-01-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除