自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(565)
  • 论坛 (1)
  • 收藏
  • 关注

原创 数据仓库实践之业务数据矩阵的设计

怀疑有如草木之芽,从真理之根萌生...0x00 概述数据仓库的设计不能完全依赖于业务的需求,但又必须服务于业务的价值。那么,该如何地从业务的角度出发,设计一套切实可行的数据仓库呢?本文将分享数据仓库实践中的业务数据矩阵的设计经验,帮助大家在工作中快速理解业务并规划数据仓库体系。本文将包含如下三部分内容:分享业务数据仓库的概念的作用 举个栗子说明 一些思考0x01 业务...

2019-01-01 11:40:52 2526

原创 漫谈数据仓库和范式

0x00 概述长期从事数据仓库的你,是否还记得数据库设计中的三大范式?在设计数据仓库的表时,是否考虑过规范化和反规范化之间的区别?是否想过数据仓库和数据库在设计中对范式考虑的侧重点是什么?本文,将包含如下几个方面: 一起回顾数据库设计中经典的三大范式 聊一聊数据仓库和范式之间的关系 聊一聊数据仓库和数据库在范式设计中的侧重点 全文将会围绕一个订单表(假设一个订...

2018-12-27 17:33:29 1384

原创 一种通用的数据仓库分层方法

0x00 概述数据分层是数据仓库设计中十分重要的一个环节,优秀的分层设计能够让整个数据体系更易理解和使用。而目前网络中大部分可以被检索到相关文章只是简单地提及数据分层的设计,或缺少明确而详细的说明,或缺少可落地实施的方案,或缺少具体的示例说明。因此,本文将指出一种通用的数据仓库分层方法,具体包含如下内容: 介绍数据分层的作用 提出一种通用的数据分层设计,以及分层设计的原则...

2018-12-27 17:31:21 4109 7

转载 数据分析不落地?典型案例教会你!

开局一张图数据从业者们经常会陷入这种窘境:一方面抱怨长期做底层的脏活儿累活儿,驱动业务的机会太少;一方面真到了要给业务献言献策的时候,又被吐槽分析出一堆已知事实没啥实际帮助很多文章都会选...

2020-12-02 08:33:00 4

转载 作为业务数据开发,我们为什么会焦虑?

作为业务数据开发,我们为什么会焦虑?|0x00 思维定势每个人都有自己的思维定势,自己的行为时时刻刻的受思维定势影响。很多人并不认为自己有思维定势,尤其是做数据的小伙伴们,我们通常倾向于...

2020-12-01 23:28:04 8

转载 如何开展企业数据资产评估

一目的由于数据本身的特性(非实体性、依托性、多样性、增值性、可加工性等),导致企业对数据资产的评估难度很大,同时由于数据资产所产生的经济效益具有不确定性,即使相同的数据面对不同的业务场景...

2020-11-29 23:49:33 12

转载 你想知道的A/B实验知识全在这里了

作者介绍@花花曾任职于美团、腾讯、今日头条担任数据分析师。操盘过上百亿的资源评估,与大家一起成长学习。01前言A/B实验的目的在于通过科学的实验设计、采样样本代表性、流量分割与小流量测试...

2020-11-29 23:49:33 24

原创 分享一个数仓小伙伴转产品的经历

0x00 前言两年前,一位做数据仓库的小伙伴来找居士咨询职业发展规划,居士当时给他的建议是可以考虑由数仓转为数据分析或者直接转为数据产品。两年后的今天,这位小伙伴差不多已经做了一年多的数...

2020-11-26 23:48:58 13

转载 【实践案例分享】网易云音乐基于 Flink + Kafka 的实时数仓建设实践

简介:本文由网易云音乐实时计算平台研发工程师岳猛分享,主要从以下四个部分将为大家介绍 Flink + Kafka 在网易云音乐的应用实战:背景Flink + Kafka 平台化设计Kaf...

2020-11-25 08:36:00 20

转载 讲讲用户的流失预警

一、什么是用户的流失预警我们都知道,对于一款相对发展已经较成熟以及市场相对饱和的产品而言,获取一个新用户的成本会远远高于留住一个老用户,老用户的流失意味着收益的减少。所以相信很多人都会...

2020-11-25 08:36:00 14

转载 【实践案例分享】图数据库在58部落社交网络的探索实践

导读随着58部落在社交网络分析应用的不断深入,社交网络数据分析需求的复杂性要求越来越高,如何在千万级别的用户中挖掘出价值用户,分析这些价值用户的社交网络关系,并提升价值用户对社区的影响力...

2020-11-24 08:19:00 10

转载 终于有人把前台、中台、后台都讲明白了

导读:很多人提到中台时自然会问:“既然有中台,那是否有前台和后台?它们各自的职责又是什么呢?”本文为你详细解答。作者:欧创新 邓頔来源:大数据DT(ID:hzdashuju)我们来看一下...

2020-11-23 08:03:00 127

转载 【实践案例分享】美团的Apache Kylin的实践与优化

总第423篇2020年 第47篇从2016年开始,美团到店餐饮技术团队就开始使用Apache Kylin作为OLAP引擎,但是随着业务的高速发展,在构建和查询层面都出现了效率问题。于是,...

2020-11-23 08:03:00 7

转载 没有这个能力的数据分析,正在被淘汰......

最近后台又收到很多粉丝工作不顺、压力山大的苦水:▎入行两年,薪资8K,涨薪太难......▎熬夜做出来的数据,被各种质疑......▎公司裁员,数据分析成了第一批......今天我们不妨...

2020-11-22 18:00:00 23

转载 大数据领域全景解析

大数据领域全景解析长文预警!这是一篇数据体系介绍文章,并不涉及开发实践。|0x00 什么是数据数据是一种对客观事物的逻辑归纳,是事实或观察的结果。随着科学技术的发展,数据的概念内涵越来越...

2020-11-21 23:38:20 94

转载 数据分析,如何挖掘潜在业务机会

“通过数据分析,找到业务的机会点”是很多公司对数据分析师的要求,然而,又是很多新人犯难的地方:啥叫业务机会点?咋从数据里看出业务机会点?为啥我找的业务机会点别人不认可?今天我们系统了解下...

2020-11-20 09:00:00 9

转载 从这份报告,我读出了数据从业者的局限与未来

开局两张图数据从业者们大家好~最近古牧君偶遇这么一份报告????,读完之后觉得比较接地气+有料,决定分享给大家~为了节省你的时间,我摘取其中重点进行导读,发车????1,数据团队发展趋势...

2020-11-19 08:33:00 9

原创 聊一聊数据团队的职责是什么?

0x00 前言最近很多小伙伴在群里或者私聊问居士这么一个问题:“数据团队的职责到底是什么?”同样都是数据组,不同公司或者说同一个公司不同团队的小伙伴有不同的遭遇:有的小伙伴天天配置报表~...

2020-11-15 22:00:55 798 4

转载 真正拖垮你的,是沉没成本

一个问:“我在这家创业公司3年了,但老板承诺的股份一直没兑现。现在想离开,但又特别不甘心,我应该怎么做”。我回复:“找老板沟通一次,如果还不兑现就当所谓的股份不存在,然后再去决定是否离开...

2020-11-09 23:52:45 148

转载 业务重要?还是技术重要?

初级工程师的困惑曾经有公众号的小伙伴后台联系我,咨询一些问题。有一个粉丝问过这样一个问题:群主,向你请教一个困扰我很久的问题,从毕业到现在,我一直从事大数据平台开发d的工作,主要是搭建C...

2020-11-09 23:52:45 51

转载 浅谈数据一致性

浅谈数据一致性|0x00 数据不一致产生的原因互联网的工程开发,与传统软件相比,往往要面临非常复杂多变的业务场景,这是老生常谈的问题了。虽然在工程开发与协同领域已经有了比较多的实践案例,...

2020-11-02 09:00:00 45

原创 为什么说你的数据团队需要一个项目管理型人才?

0x01 这些场景,你也有遇到吗?你所在或者所管理的数据团队是否有遇到过类似的场景:团队成员每天做的都是一些重复性的工作内容,比如提数,亦或是做报表~做事情的时候,团队成员各自为战,缺少...

2020-11-01 21:44:47 20

转载 【好书推荐:第6期】数据分析通识(文末赠书)

最近很多小伙伴都来找居士咨询关于数据分析相关的问题,而居士在市面上也一直没有找到这样一本专门针对数据分析的体系性书籍。幸好,现在有这样一本书面世了,就是我的好友的新书《数据分析通识》。当...

2020-10-28 10:49:55 69 1

转载 从DataPhin看数据中台的另类理解

从DataPhin看数据中台的另类理解|0x00 数据中台的另类理解今天不讲细节,仅谈学习思路。数据中台官网:https://dp.alibaba.com/indexOneData官网:...

2020-10-25 23:36:45 107

转载 聊一聊数据洞察

聊一聊数据洞察|0x00 数据洞察是什么最近有一个词谈的非常多:“数据洞察”,在大数据时代,数据是业务增长的基础,就像石油一样,如果不掌握核心数据,就缺少了核心的资源。但掌握了核心数据,...

2020-10-21 23:29:00 45

转载 数仓治理一场仗

数仓治理一场仗|0x00 老大难的数仓治理“年年数据要治理,数据年年治不好”。数仓治理的老大难,通常是跟着业务需求快跑,要不是数据零散在各个团队,或者是大家的研发规范有不同,作为一项通过...

2020-10-20 23:52:09 68

转载 一天10个数据需求!让数据分析师崩溃有多简单?

前段时间新业务上线,接到了很多的数据挖掘和分析需求,每天加班到十点多。偏偏需求的节点又非常紧,产品、增长、运营、市场各方大佬们,都在不断地催促我们提供数据决策!基本每天都是好几个需求,还...

2020-10-13 08:58:00 34

原创 为什么你的数据仓库项目推进不下去?

为什么你的数据仓库项目推进不下去?0x00 前言最近很多小伙伴都来找居士咨询类似的问题:我的数据仓库规范设计的很好,为什么大家却不执行?数据仓库规范推着推着,感觉项目就凉了,不能持续?老...

2020-10-12 21:22:00 54

转载 数据分析师的绩效,该如何考核?

数据分析师的工作绩效到底该怎么定?这个又是一个很蛋疼的话题,甚至很多从业很久的老鸟都没想明白,也很容易中坑。所有部门里,数据分析的绩效可能是最蛋疼的。其他部门的职责和绩效都非常清晰。比...

2020-10-10 20:58:00 35

转载 数据分析师天天提数,该如何破局?

“那谁谁麻烦给我跑个数!”干咱们这行的,最讨厌听到这句话,如果有更讨厌的,就是在你快下班时听到了这句话,还得在下班前就给到他。很多人挂着“数据分析师”的 title,实际上干着人肉跑数机...

2020-10-09 09:16:28 127

转载 什么是数据敏感度?怎么培养数据敏感度?

前几天,群里小伙伴提问什么是数据敏感度?提这个问题是因为她的主管自诩数据敏感度很高,做为下属的她想知道到底什么是数据敏感度,怎么培养数据敏感度。1.什么是数据敏感度?数据敏感度高的人,看...

2020-09-28 21:37:00 261

转载 ​浅谈领域模型

浅谈领域模型|0x00 领域模型是什么领域模型是什么?一句话:“经济基础决定上层建筑”中的“经济基础”,是帮助理解复杂业务领域问题的基石。有人说:“领域模型是一个商业概念,同行业的企业,...

2020-09-26 22:36:09 67

转载 数据分析师,你是车夫,还是拉车的驴子

“数据驱动业务”是句非常时髦的话,也是让很多同学头疼的话。因为这玩意看得见摸不着呀。天天光听着喊“驱动”“驱动”,可到底咋驱不知道。而且问个问题也被业务喷,提个意见业务也不听,还总嫌弃数...

2020-09-26 22:36:09 170

转载 架构方法论

架构方法论|0x00 架构思维相信很多人,谈起架构,第一印象,就是各种各样的架构图,有一个高高在上的人,坐在那里,阔谈自己的理念。诚然画图是架构师的一项日常工作,但通过一张图,来道出事物...

2020-09-23 20:05:00 98

转载 【好书推荐:第5期】数据产品经理:实战进阶(文末赠书)

最近很多小伙伴都来找居士咨询关于数据产品经理相关的问题,而市面上也一直缺少这样专门针对数据产品经理的体系性书籍。幸好,现在有这样一本书面世了,就是我的好友的新书《数据产品经理:实战进阶》...

2020-09-20 17:51:47 377

转载 前腾讯员工不堪房价压力回老家进国企!过上清闲的日子,他又担心……

一直有人调侃:大城市放不下肉身,小城市容不下灵魂。最近,一位前腾讯员工分享了他的经历:因为深圳房价暴涨,辞职回了老家,找到一份国企的工作,过着清闲舒服的日子,可又担心再这么下去自己就废了...

2020-09-18 09:00:00 326

转载 数据分析师与需求方的“尔虞我诈”

写给所有被提过需求的职友们。0x01 令人舒服的关系我一直很认同一个观点:数据和业务首先是合作关系,然后才是服务关系。然鹅,能碰到同具备这样观点的人少之甚少,数据分析师在公司的地位,不是...

2020-09-17 21:44:00 31

转载 用户画像实践:神策标签生产引擎架构

分享嘉宾:王琛@神策数据编辑整理:冯露出品平台:DataFunTalk导读:用户画像是建立在数据基础之上的用户模型,是产品改进、精准营销等业务场景中不可或缺的重要基础。而构建用户画像的过...

2020-09-17 21:44:00 379

转载 浅谈数据可视化

浅谈数据可视化|0x00 摩尔定律带来新的机遇说起“数据可视化”,很多人的第一反应便聚焦在“数据”两个字上,其实“可视化”三个字的意义要更重要一些。说起“可视化”,就需要提起一组数字:“...

2020-09-15 09:00:00 66

转载 All In Cloud 时代,如何定义下一代云上大数据分析技术?

据 IDC 预测,全球数据量将从 2018 年的 33 ZB 增长到 2025 年的 175 ZB。凭借弹性扩容、按需付费等优点,企业数据上云已经成为潮流,随着云上基础设施的快速发展和迁...

2020-09-14 09:02:00 80

空空如也

木东居士的留言板

发表于 2020-01-02 最后回复 2020-01-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除