自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(612)
  • 收藏
  • 关注

原创 数据仓库实践之业务数据矩阵的设计

怀疑有如草木之芽,从真理之根萌生...0x00 概述数据仓库的设计不能完全依赖于业务的需求,但又必须服务于业务的价值。那么,该如何地从业务的角度出发,设计一套切实可行的数据仓库呢?本文将分享数据仓库实践中的业务数据矩阵的设计经验,帮助大家在工作中快速理解业务并规划数据仓库体系。本文将包含如下三部分内容:分享业务数据仓库的概念的作用 举个栗子说明 一些思考0x01 业务...

2019-01-01 11:40:52 3825 1

原创 漫谈数据仓库和范式

0x00 概述长期从事数据仓库的你,是否还记得数据库设计中的三大范式?在设计数据仓库的表时,是否考虑过规范化和反规范化之间的区别?是否想过数据仓库和数据库在设计中对范式考虑的侧重点是什么?本文,将包含如下几个方面: 一起回顾数据库设计中经典的三大范式 聊一聊数据仓库和范式之间的关系 聊一聊数据仓库和数据库在范式设计中的侧重点 全文将会围绕一个订单表(假设一个订...

2018-12-27 17:33:29 1963

原创 一种通用的数据仓库分层方法

0x00 概述数据分层是数据仓库设计中十分重要的一个环节,优秀的分层设计能够让整个数据体系更易理解和使用。而目前网络中大部分可以被检索到相关文章只是简单地提及数据分层的设计,或缺少明确而详细的说明,或缺少可落地实施的方案,或缺少具体的示例说明。因此,本文将指出一种通用的数据仓库分层方法,具体包含如下内容: 介绍数据分层的作用 提出一种通用的数据分层设计,以及分层设计的原则...

2018-12-27 17:31:21 7736 9

原创 无题

今天在思考一个问题,关于互联网行业的,其他行业还不太清楚不敢妄加评论。 互联网行业在当前社会中其实面临着很多社会问题需要解决和探索,比如职业发展的不确定性、35岁的职业危机、职业社交关系的...

2021-10-31 19:43:51 258

原创 直播PPT分享-如何体现数据同学的业务敏感度

今天即兴给大家直播分享了一次,反馈还比较不错,不少童鞋私信我要ppt,这里就统一发出来给大家参考了,其实内容很少,6句话搞定。以后,居士会不定期地直播分享,主题和时间都不确定,所以,大家可...

2021-09-13 00:45:31 387

原创 漫谈数据团队协作之各岗位间的相互尊重

最近和几位资深的团队管理者聊团队协作,受益匪浅,其中有一个观点令居士印象深刻:想让团队成员之间能够默契地协作,有非常多的方法,但是,有一个很重要且很基本的要求是:相互尊重。脱离了团队成员之...

2021-07-05 00:14:10 537

原创 漫谈算法工程师那些事儿

漫谈算法工程师那些事儿做了一段时间的算法工程师,经历了电商和广告算法的两大业务场景的洗礼,今天和大家分享一些自己关于算法工程师的一些感受~大家眼中的算法工程师一千个小伙伴的心中,有一千种算...

2021-07-01 00:13:03 264

原创 漫谈数据从业者的数据敏感度

前几天有一位从后台转数据仓库的小伙伴找居士咨询,如何提升自己的数据敏感度。挺常被问到的一个问题,也是很虚的一个问题,因为它很难去衡量。但是,数据从业者,不论是数据开发、数据分析、算法工程师...

2021-06-29 00:50:22 213

原创 漫谈什么是数据科学家?

数据工程师、数据分析师、算法工程师、数据科学家近半年,居士看了很多关于数据科学家的模模糊糊的概念,也听了很多所谓数据科学家讲到自己比数据分析怎么怎么厉害,但,细问其和数据分析、数据挖掘有何...

2021-06-27 22:32:47 163

原创 漫谈如何伤害一只数据分析师

愿你历尽千帆,归来仍是少年。告诉它,数据分析师就是用来给我们业务侧提数的,并且这么付出行动。安排它,天天做数据清洗、提取的工作,并且告诉它,不要只做数据基础建设,要懂得使用数据,让数据发挥...

2021-06-24 02:21:38 185

原创 【木东在读】这样的领导,跟定了!

断更好久了,恢复一下最近忙于处理工作里面的各种乱七八糟的闹心事,而且写了那么一个多月的材料,实在是没有过多的能量来写文章。以前是工作时候写代码,工作之外写文字,最近倒是好了,工作的时候写文...

2021-04-03 21:00:00 343

原创 如何在工作群中引起同事的不适?

0x00 前言今天给大家分享的话题比较有意思,也是春节前和几位小伙伴散步聊天时的收获,趁着还没正式开工,给大家分享一下~如何在工作群中引起同事的不适?大家在工作场景中,不仅会各种内卷、奋斗...

2021-02-17 20:12:59 744 2

转载 数字化时代,聊聊“主数据”

数字化时代,聊聊“主数据”|0x00 数字化是一种“阳谋”2016年的云栖大会,马云提到了未来的五个大趋势:“新零售、新制造、新金融、新技术与新能源”,排在第一个的,就是“新零售”。那么...

2021-01-26 08:31:00 313

转载 A/B 测试、效果评估、广告归因,数据分析不会的,手把手教你

「DataGo数据狗」公众号原创【数据运营36计】系列已发布 23 篇文章讲述日产工作中遇到的真实的 A/B 测试问题,因果推断等方法论,其中 6 篇付费文章300多位分析师付费阅读,文...

2021-01-26 08:31:00 794

转载 数据和技术驱动下的投放效率优化

业内流行着这样一句话:用户增长三板斧,投放、push和分享。渠道投放是用户增长非常重要的一个方向,以往渠道投放更多是重商务、渠道和运营,现在已经发展成了一个通过数据和技术驱动不断优化,精...

2021-01-25 22:41:02 367

转载 Pandas数据分析实战最强学习手册(附源数据代码)

大家好,我是木东居士~用Python做数据分析,绕不开的就是Pandas库,这个库实在是太NB了!只是Pandas相关学习资料很多,坑也非常之多。不少同学在啃完一些书后,觉得自己什么都懂...

2021-01-19 12:00:00 315

转载 【木东在读】用户增长的这个坑,你还在躺里面吗?

木东居士数据从业者接着上一篇用户增长的文章《【木东在读】一张图阐述用户增长全链路技术图谱》,今天再分享一篇大佬写的好文。从居士的角度来理解,做增长,本质上还是要为用户提供有价值的东西,而...

2021-01-18 23:22:50 166 1

转载 数据分析师为什么要懂商业思维?

2020年,除了“直播带货” “私域流量池”“线上线下结合”等热门词语,其中不常被提起、却至关重要的就是“数字营销”了。以众所周知的星巴克“猫爪杯”为例,一经推出就火遍全网,在这款产...

2021-01-15 08:27:00 232

转载 【木东在读】终于有人把标签设计讲明白了

木东居士数据从业者又是因为一张图转载的一篇文章,关于标签的分类,可以直接参考本文的划分。在做标签的时候,首先要提的一般是用户画像,而用户画像一般是由两部分组成的:标签和特征,很多小伙伴在...

2021-01-14 07:47:00 565

转载 整理分享!数据分析面试经验+必读书籍+简历模版

你们好,我是居士!最近有很多的小伙伴问我说了解一些Python、SQL,想转行数据分析,如何去准备?对于这个问题,我想好友宝器的文章和整理的干货能给大家一些帮助。可能很多老读者应该都关注...

2021-01-12 12:00:00 385

转载 【木东在读】一张图阐述用户增长全链路技术图谱

木东居士数据从业者用户增长一直是一个比较热门的话题,特别在互联网行业,大多数数据分析团队都会接触和增长相关的业务场景。而在用户增长领域里面,最常见的应该当属于AAARR模型,AARRR是...

2021-01-11 22:16:55 769

转载 统计中存在的悖论

我们的大脑的确不能很好地处理概率问题,所以对错误的出现我并不感到惊讶。——统计学家 戴康尼斯引言正如上面统计学家所说,人类不善于处理概率问题,以至于有时候用概率解释问题的答案,超乎人的想...

2021-01-10 21:22:48 389

转载 如何用DBSCAN聚类模型做数据分析?

DBSCAN属于无监督学习算法,无监督算法的内涵是观察无标签数据集自动发现隐藏结构和层次,在无标签数据中寻找隐藏规律。聚类模型在数据分析当中的应用:既可以作为一个单独过程,用于寻找数据内...

2021-01-10 21:22:48 1095 1

转载 如何用聚类模型(k-means)做数据分析?

k-means属于无监督学习算法,无监督算法的内涵是观察无标签数据集自动发现隐藏结构和层次,在无标签数据中寻找隐藏规律。聚类模型在数据分析当中的应用:既可以作为一个单独过程,用于寻找数...

2021-01-10 21:22:48 2585

转载 手把手演示如何规划一个企业级数据中台

木东居士非著名数据从业者“什么是数据中台?”这个问题在2020年初还有很多小伙伴经常在群里询问,然而还没到21年,就传出来了阿里要去中台化的消息,颇有一种刚上车,车就要坏了的感觉。那么...

2021-01-07 08:06:00 455

转载 用户分层,该怎么分才合理(实操版)

本文读完需要很认真,请追求进步的你坚持阅读到最后,并且点个在看证明你读完了【木东居士】在用户画像的建设中,很少有团队不提用户分层的,比如说你的活跃用户分层(高、中、低活跃用户)、付费用户...

2021-01-05 08:19:00 1430

转载 为什么好的流程得不到贯彻?

【木东居士】想要在一个团队中快速高效的推进一件事情,有两种比较有效的途径:一为提升合作方之间的关系,通过人情提效;一为制定好相应的流程和规范,通过约束提效。前者虽好,但是具备高情商素质的...

2021-01-03 20:45:53 98

原创 关于2021的一些想法

昨天发了2020年的总结后,收到了不少朋友的反馈,有希望居士能坚持保持原创的,有希望居士多关注社群运营的,有吐槽居士原创变少了的,也有好奇居士后面有什么规划。因此,今天居士就聊一下21年...

2021-01-02 16:30:12 530 6

原创 聊一聊2020年的总结和思考

2020年,突然间就过去了,当我开始写这篇总结的时候,都感觉还没有适应今天已经是2021年的1月1号,脑子里面想到的最大的影响就是,以后数据表的时间分区就该变成20210101这种了,周...

2021-01-01 21:09:33 164 1

转载 面到阿里月薪 35k 数据PM岗,很难?

最近,我在后台看到有位同学问:身边几个朋友、同事都转岗做数据产品经理了,其中一个前同事,转行工作两年就全款买了房,羡慕得不得了!于是自己也想考虑转行,数据产品经理现在很吃香吗?我想回答这...

2020-12-28 12:35:41 423

转载 offer该怎么选:大公司or小公司?高薪or期权?

阅读本文大概需要3分钟。关于工作选择的话题,旧文也写过:如何判断好公司、怎么跳槽之类。最近到了秋招,不少读者问怎么选择offer的问题,回答的多了就想着再写一篇文章,希望对大家有帮助:第...

2020-12-27 23:42:56 420

转载 不懂归因,也许你广告还没入门

题目取得有点浮夸,主要是用于哗众取宠,为了避免冒犯读者,我首先得承认,我在广告行业确实也没入门。只是干了几年,有些想法要说说。归因的逻辑对于广告来说确实非常重要,如果你不认同,我也没打算...

2020-12-27 23:42:56 1546

转载 基于业务计划和收益的数据资产价值评估研究

摘要本文阐释数据资产和数据资产价值评估的概念,分析和总结了数据资产价值评估的一般方法及其优缺点,经比较分析得出基于业务收益评估数据资产价值具有一定的可行性。本文提出了基于业务计划和收益的...

2020-12-25 09:00:00 825

转载 数据分析必看的oCPM/oCPC核心知识点

文章一共3500多字,读完预计需要30分钟,不过内容相对独立,有兴趣可以先收藏后查阅。OCPM 或者OCPC 能力在最近几年得到长足的发展,在广告行业中大放异彩,如果一个广告平台不支持...

2020-12-25 09:00:00 2005 1

转载 广告平台和广告主是如何互相“窃取”数据的(上)

互联网广告经过多年的发展,在广告的生态中,广告平台和广告主的关系就像战争时敌我双方的关系,互相博弈,相互渗透。渗透的本质主要是获取信息。拥有大的用户基数的公司通常都会自建广告平台,这...

2020-12-23 21:49:00 432

转载 广告平台和广告主是如何互相“窃取”数据的(下)

渗透往往都是互相的,当敌人出现在你的狙击射程内的时候,切记,你也在敌人射程内。前文说到广告平台通过各种方式获取到广告主后端相关数据,主要用于优化广告模型,使得用户的定向和预估能力更加精...

2020-12-23 21:49:00 410

转载 系统思考数据质量

系统思考数据质量|0x00 质量标准体系在谈一件事情的质量时,我们通常会想起ISO的标准,例如ISO9000,如果一件商品被打上了ISO的标签,对于自己产品的质量,是一件最有说服力的证据...

2020-12-22 19:16:08 144

原创 数据质量监控

0x00 概述随着大数据时代的带来,数据的应用也日趋繁茂,越来越多的应用和服务都基于数据而建立,数据的重要性不言而喻。而且,数据质量是数据分析和数据挖掘结论有效性和准确性的基础,也是这一...

2020-12-22 19:16:08 559

转载 都快2021年了,居然还有数据分析师不会MECE

几乎所有数据分析的书、教程、文章,都很政治正确写上MECE作为数据分析的准则。这东西很快又成为一个数据领域的“咕咚来了”:到底啥是MECE为啥非得MECE我做的是不是MECE一大堆问号没...

2020-12-21 21:47:00 167

转载 【猫娘小可爱频道】闲聊+1

本篇是居士养的一只喵,看了一个视频后的观后感,视频已附在文章末尾,可点击小程序观看。欢迎大家讨论~喵喵看这个视频突然产生的一个想法,是比较有实感的感觉到了时间的美感或者四维时间轴对事物的...

2020-12-21 21:47:00 78

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除