自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

晓阳的数据小站

通过数据,让思考更多一点;通过分享,让技术深入人心。

  • 博客(128)
  • 收藏
  • 关注

原创 流批一体不只有Flink,还有实时数据模型

|0x00 从流批一体诞生的必然性说起通常来讲,数据仓库的建设,都是以离线作为主要的密报,下游的应用,不论是报表还是接口,所提供的数据也大多是T-1时效性。但伴随着业务的变化,当离线做到没什么可以继续做的时候,实时就会被拿出来,作为新一个阶段的目标进行攻克。在流批一体建设之前,这种实时诉求通常会开发成分钟级的任务,通过近实时的方案来解决业务的问题,但分钟级会带来诸如任务过多、资源挤占较大、无法支持复杂逻辑等问题。因此专门支持实时计算的框架,比如早期的Storm,能够尝试从纯实时的角度解决业务问题,就

2021-12-21 18:54:20 1447

原创 数据资产的管理方法

|0x00 数据资产的重要性在最近几年的业务发展中,数据都是各大公司建设的“宠儿”,几乎所有的业务都围绕数据展开,其重要性堪比信息化时代的“石油”。因此,大多数的公司都会建设自己的数据资产平台,一方面是为了做一些诸如统一数据口径一类的基础工作,另一方面也是为了深入挖掘数据的价值,为企业带来高额的利润回报。回看过去的发展历史,围绕着数据的采集、建设、管理和应用,已经基本形成了体系化的建设方法。运营在做定价的时候,需要数据的支持;财务在评估预算的时候,需要数据的支持;法务在判定风险时,同样需要数据的支持……

2021-12-06 20:46:51 409

原创 对于提升团队研发效率的思考

|0x00 研发效率提不上去的根因数据,通常也会视为“研发部门”的一部分,自然也面临需求交付效率、数据质量、稳定性等一系列问题,其实在研发眼中,一切问题的根因似乎可以总结为“需求多、压力大”,有充分的时间,是可以解决掉质量相关的问题。但事实上,大部分的公司,都是在业务的狂奔中去做需求,一旦业务发展停滞下来,要么意味着要人员优化了,要么意味着没什么需求可以做,程序员可以打酱油了,这都不是一种健康的发展状态。因此,解决业务高速发展情况下的研发效率问题,是我们的一门必修课。在本文中,我试着把一些做不好的问题

2021-11-29 20:33:16 804

原创 大厂里如何看待合作这件事

|0x00 正确看待合作现如今,大家在大厂里做事情,都会比较有目的性,比如拿项目、拿结果、促晋升,等等。但由于系统组织的复杂性,做好一件事情,往往是需要“合作”的。这种合作并不仅仅是多个职能在一起协同,做一下敏捷项目,就可以拿到结果,而是代表更高的“Owner”意识要求,即我主动发起、我主动推动、我主动拿到结果的“主动”行为。可以说,越往上走,偏执性的内容就越少,“主动”的占比就越大,在这里面,“合作”就显得非常重要了。除了我们一般所熟知的“技术专业”等内容外,合作还需要有一些“利益”上的绑定。《亮剑》

2021-11-10 20:30:12 267

原创 新人数据技术如何快速提升

很多时候,新人技能并不局限于刚参加工作的年轻人,换一份新工作时,也能够根据一些技巧,来快速的熟悉和学习新公司的技术体系。|0x00 初来乍到对于数据技术而言,基础的技能有三种,一个是熟悉你所使用的数据平台和工具,一个是熟悉开发过程中的流程与规范,最后一个是熟练使用开发使用的语言。对于数据平台和工具而言,一般情况下都是在Hadoop生态下做开发,但对于一些有特殊要求的团队,Spark和Flink已经得到了成熟的应用,这时候在熟悉平台的操作前,先通过官方文档,熟悉这种技术框架的设计原理,对于后续理解程序的

2021-10-26 19:36:51 153

原创 做好研发管理的四点总结

|0x00 做好项目管理研发管理的范畴比较广,但个人认为,不论是Java、Python这样的后端开发,或者是IOS、安卓这一类的客户端开发,还是数据仓库、数据研发这一类的数据岗位,其本质都是需要通过技术来赋能业务的工种,都需要有完整的研发管理体系。常见的研发管理,有基于PMP做过程管理的,有基于敏捷做变化适应性的,有基于CMMI做瀑布开发的,而互联网常见的研发模式,则是“OKR - 项目 - 需求/缺陷”这一套方法,在细节执行层面有一定的不同。因此,项目就是团队目标的第一体现,关系到了KR的完成情况,

2021-10-19 18:01:50 328

原创 我读《格鲁夫给经理人的第一课》

|0x00 写在开头这本书又称之为“管理者的圣经”,由全球计算机芯片供应商、大名鼎鼎的英特尔公司的创始人“安迪·格鲁夫”撰写。现在很多人热衷于读MBA专业,或者是考PMP证书,本质都是想提升自己的管理能力,在未来职场的发展中占据有利的位置。可不论是上课还是考试,想真的掌握管理的精髓,却是一件不太容易的事情,因为管理是一门实践的学问,无论课堂上学到什么,都需要自己亲身去操盘,这个过程是必不可少的。所以,《格鲁夫给经理人的第一课》,就提供了一些实践操盘的例子,并讲述其中的缘由,这对于刚刚涉足管理这门学科

2021-10-15 09:36:48 330

原创 数据产品的核心能力

|0x00 先从产品经理特质说起做数据久了,往往会发现,有一个好的数据产品搭档,是很难的一个事情。因为作为串联起技术与业务的沟通人,数据产品不光是要懂业务,更要懂数据,而这两方面能力都具备的人才,其实是很少的。如果用一句话来形容数据产品经理的职责,我想大概便是:“提升数据资产的应用能力”,而我们常说的“分析思路产品化”,是实现这一职责的手段。在继续说数据产品之前,我想先谈谈产品经理的特质。产品经理通常有三种特质,是需要不断学习和加深的,这三种分别是“感性理性”、“产品理念”与“从0到1”。“感性与理

2021-10-08 20:09:52 283

原创 数据开发如何巧妙解决业务问题

|0x00 数据研发的技能栈“你的价值是什么?”这可能是做数据的同学,最经常被问到的问题。早期数据从业者是比较开心的,能够应用Hadoop框架做工具,就已经能够解决mysql时代面临的海量数据问题了,价值不言而喻。有道是:“会写MR,月薪过万”。但是如今,随着工具的不断发展和完善,尤其是商业化方案的高度完善,会使用大数据工具,来处理海量数据,已经是从业新人的标配了,甚至很多非专业的人士都能够轻松驾驭。这个事情,如何更进一步,利用数据技术,来解决业务问题,就是行业对于从业者的新要求了。|0x01 问题

2021-09-23 19:25:37 174

原创 数据能力的构建过程

|0x00 数据能力是什么我们经常问自己“什么是数据能力,数据能力如何构建”?我想,没有哪个业务,一开始就是明确知道自己想要什么,都是经过一定时间的摸索之后,才能积累出丰富的经验,这时候数据能力才有了勇武之地。比如电商行业中,OneData方法形成之后,在其他的电商和类电商业务中,就可以快速铺开应用;而随着越来越多的企业加入到数字化的浪潮,云上中台的概念也就逐步落地。因此,理解数据能力的构成,懂得每个阶段数据所能够发挥的作用,就是数据同学所需要具备的基本能力,也是我们日常工作时进行规划的前提。|0x

2021-09-14 18:34:22 241

原创 数据开发的技术提升之道

|0x00 数据开发数据开发在大型互联网公司中,通常是贴近业务的角色,因为数据相关的工具,比如开发工具、监控工具、血缘工具、质量工具,都做的非常完善了,甚至能够对外提供商业化产品。在这种情况下,数据开发的工作,从偏底层的大数据引擎建设,提升到了面向业务的数据仓库 + 数据分析角色,也就是从幕后逐步的走向前台,最终目标是以数据科学家为导向。在这种情况下,如果论常规的技术提升,那么除了精进SQL技巧之外,恐怕很难有其他突破的方式,本文就探讨一些与数据开发相关的技术,从这些方向可以尝试进行突破,一样能够做的非

2021-09-07 10:38:44 888

原创 数据开发,如何平衡效率与质量

|0x00 质量VS效率我一直有一个观点:“数据模型设计的是商业模式,是产品逻辑;数据结果反映的是业务实操,是实际现状。”数据开发的效率,是如何尽快的将产品设计、业务过程,转换为数据模型;数据开发的质量,则是如何尽快的将数据加工过程中的问题,识别出来。向业务交付的内容,是开发的内容;而如果开发的时候,忽略质量的问题,虽然交付的时候不会有感知,但往往会在排查问题阶段,把这些时间加倍的补偿回来。很多时候,开发同学会觉得,做这么多质量工作是“无效”的,因为很多问题,并不需要数据同学对业务有太深入的了解,如果

2021-08-31 08:10:35 386

原创 浅谈BI分析师

|0x00 BI的定义对于BI的定义,大家是各有各的说法,但比较普遍和默认的一种讲法,是用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。当然,对于一些非互联网从业者而言,这么说会比较费解,那么我们可以有一种更简洁的说法:“将大数据转化为业务知识,帮助企业做经营决策”,理解起来就要容易许多。但如果我们要深入理解BI所代表的概念,就要有一些独特的看问题视角了。从数据分析的视角看,BI是面向研究主题的一个分析过程,收集与主题相关的有价值、高质量数据,并对数据进行分析验

2021-08-23 18:55:06 341

原创 中台难,前台更难,为什么支持业务这么难

|0x00 拿结果,拿的是什么在“中台”如火如荼发展的这些年里,“前台”过的也并不舒服。尽管中台提供的能力在不断完善,但业务战场一日一变,仅买菜赛道,就有团购物流、即时物流、仓配物流、快递物流、分销物流等多种业务模式,在决出最终赢家之前,前台尚且不能自保,中台也无法发挥价值。在过去,非常成熟的电商体系,在前台战场上打赢了,中台才具备了长期存在的意义。时至今日,我们可以这么讲,前台依旧是非常重要的,决定了中台的存亡。在前台业务中,最重要的事情,就是“拿结果”。我们往往会讲,作为团队TL,要有“建团队

2021-08-12 18:12:02 271

原创 浅谈用户画像

|0x00 用户画像是什么用户画像(Personas),最早由交互设计之父Alan Cooper提出,原意是建立在一系列真实数据之上的目标用户模型,也可以理解为真实用户的虚拟代表,用于描述自然人的属性。在互联网中,也可以理解为用户标签(Profile)的概念,与大数据概念强相关,通过数据来刻画用户。在笔者的心目中,用户画像可以理解为“基于用户行为数据而获取的用户形式化表达”,通过用户的行为特征、社会属性等各个维度的数据,展示目标用户群体的全貌信息,并根据这些信息挖掘其潜在价值,是数据分析与应用的基础,也

2021-08-09 18:53:16 809

原创 浅谈漏斗分析

|0x00 什么是漏斗分析说起数据分析,很多人把精力放在了各种高大上的数据模型上。事实上,比较常见的一些数据分析方法,往往都不是什么非常高深的学问,在实践中,涉及到的方法论或者复杂性,其实是远低于学校里学习的专业知识。而我们非常看重数据分析,本质是看重“数据”,以及利用数据来做的“分析”,好的结论不一定有多么高大上的模型,但它一定有数据作为支持。现如今我们所做的各种决策,都在强调数据的重要性,不论是市场调研的数据,还是产品上线后的用户数据,都贯穿了产品研发的整个生命周期。今天我们来讲一个原理非常简单,

2021-08-02 21:22:01 773

原创 数据治理实操

|0x00 数据治理的思路数据治理是互联网公司中,普遍遇到的痛点,不论是作为业务支持的“数据仓库”部门,还是承担辅助角色的“数据分析”部门,天天被人追着问:“我们有什么数据?这数据对吗?为什么还没跑出来?你到底能不能做?”当矛盾对喷到“忍无可忍”时,数据治理工程便提上了“台面”,因为开发没了服务对象等于丢了饭碗,而业务脱离数据在互联网时代又等同于“裸奔”,双方打的难解难分。但其实数据治理是一项比较大的工程,在实际工作中,我们需要缩小范围,“把好钢用在刀刃上”。因此,个人倾向于如下的概念,即:数据治理

2021-07-27 19:40:08 234

原创 如何用科学的方法,保障数据准确性

|0x00 问题描述上周收到一位读者的询问:怎么保证数据的正确性?以下是原文:上游,会遇到根源性问题,比如客户端在数据上报时就传错的情况,比如手抖把下单时间不小心上报成了用户点击商品详情的时间.中游,指标的计算正确与否完全依赖于开发人员对于指标含义的理解以及业务方对于数据结果的敏感程度,一旦有一方出现问题即使指标统计错误也无人可以发现,甚至开发人员写错统计代码,或者由于字段的值异常, 代码没有处理好异常等等导致计算脚本异常中断,都会导致计算结果的偏差.下游,业务方看到指标时,可能也对指标的统计口径

2021-07-20 09:21:43 3837

原创 大厂晋升,你所需要知道的那些事

|0x00 如何理解晋升晋升,就像是打怪升级,像王者荣耀,段位晋升,不仅代表自己水平上升了,也代表了下一个层级的玩法发生了变化,要重新的适应。晋升,并不代表“能力”有提升,而是代表“认知”有提升,能够做、并实际做下一个层级的事情,因此,苦劳不代表结果,功劳才是晋升看重的,这是大多数人的认知误区。晋升,也往往意味着停止成长,你所积累的全部力量,都在晋升的过程中释放了,因此晋升结束后,往往会有一种怅然若失的感觉,不知道接下来要做什么。晋升主要围绕两个主题展开,一个是“技术提效”,用技术的力量推动公司效率

2021-07-12 19:15:03 211

原创 数据仓库有坑怎么办,如何从0到1来填坑

|0x00 什么是数据仓库的坑“填坑”是一个新人刚加入团队,或者是接手一个新业务,所以经常需要面对的事情。“坑”的出现,与历史业务的发展,密切相关。通常体现在:业务快速变动、人员快速流动、系统化建设能力弱、强行上马面子工程等情况。虽然数据开发人员能够意识到数据仓库规范性的重要,但迫于日常的数据开发压力,往往只能匆忙的制订一份规范,在实际开发过过程中,往往又无法完全照搬落实,因此形成了一个“不成熟”的数据仓库体系。这种数据仓库体系,最典型的特征,是找数据只能给表,无法通过规范自主查找;看逻辑只能问人,无

2021-07-06 08:28:40 264

原创 技术人的进阶之路:如何想清楚技术主管的职责

很多同学在向更高一级进阶的时候,往往会遇到很多困惑,最常见的,就是自己的技术能力,是不等于管理能力的,自己能做好事情,不代表团队能做好事情。除去职责本身的变化外,我们还需要从全新的视角,来看待自己做的事情,本文便从“看清楚”这件事情出发,来讲解技术主管的职责。|0x00 技术团队的构成我们首先讲一下,技术团队的职责是什么?通常而言,一线技术团队是以工程师为主要团队成员,辅助以测试、产品、项目经理等其他岗位的支持,目标是交付满足干系人需求的产品或者系统,而干系人一般指代我们所称呼的业务方。技术团队通常需

2021-06-29 21:02:53 337

原创 数据新人的那些困惑

|0x00 新人的焦虑在很多大公司中,底层的技术能力,封装的已经很完善了,作为数据从业者,基本上只需要写写SQL,配合运营做简单的数据分析,就可以满足岗位要求,不论是数据开发,还是数据分析,技术上的竞争力体现不出来,这一点与许多的小公司不同,那么我们的竞争壁垒在哪里?|0x01 先解惑先说两个核心的论点:未来除了核心研发岗,大部分岗位都是工具人,不论是开发还是分析师;数据开发、分析、产品、运营,未来核心竞争力,在于利用数据技术,解决业务问题。新人应该关注的内容:在升技术专家之前,这些不

2021-06-26 14:56:45 106

原创 聊聊招聘那些事

|0x00 招聘的目的在正式开始文章之前,先简单问一句,我们为什么需要招聘?可能很多人并没有具体想过,或许是团队事情太多了,那就招个人;或者是部门突然有了HC,那就招聘吧;再或者,某个人离职了,我们需要补充人力,也要招聘。但其实,招聘也是分目的,最典型的需要,是看候选人,能够为团队带来什么,如果只是招聘一个打工的人,那么显然这个定位是不符合团队长期发展需要的,因为在流动性如此之高的今天,团队有人员变动很正常,但留下来的摊子,还得继续去张罗。所以,招聘其实是寻找与团队文化相符合、并且能够补充团队短板的人

2021-06-24 08:18:27 94

原创 探索流批一体结构下的实时数仓

|0x00 越来越高的时效性要求在数据仓库的建设过程里,我们一直秉承着“离线先行”的方针,因为离线的技术栈非常成熟,开发起来很快,同时监控工具也做的比较完善,出了问题能及时发现、及时处理。过去我们处理实时的需求,一般都会转化为准实时的模式,例如分钟级调度,但毕竟它不是完全的实时模式,不过绝大多数情况下,应对业务诉求也是足够了。但随着Flink为代表的新一代框架的出现,很多业务已经不再满足于做准实时的开发了,完全实时化的数据流、面向实时做的数仓设计,就成为了数据和业务都关心的高价值项目。哪怕是没有实时的诉

2021-06-17 09:12:10 286

原创 数据驱动产品,为什么这么重要

|0x00 传统产品迭代产品迭代,往往是向软件工程领域的项目制借鉴经验,如今,考一个PMP证书在互联网公司中变得非常普遍,但这种方式真的适合互联网公司吗?软件开发的模式,从瀑布式、迭代式,走入了如今的敏捷式,变化的是项目组织的过程,这个确实很有用。但是,在PMP中,需求的明确需要干系人参与,我们互联网行业干系人是谁?应该说,是海量的用户。2B和2C目标群体的不同,决定了项目、产品的组织方式,也会随之发生变化。过去,在互联网公司中,产品提出需求、工程团队实现、测试团队验收、数据团队统计结果,往往要几个月

2021-06-08 09:19:47 200

原创 数据的Sense,离不开数据分析思维

这篇文章讲解一些数据分析的知识,因为不论是开发、分析师、产品、运营,在数字化时代,掌握数据分析的基本概念,是一项必备的工作技能。我们经常提到的“数据Sense”,也可以概括为“数据分析思维”。本文包括如下四个部分:1.为什么数据分析很重要2.常见的分析方法有哪些3.数据驱动的一些方法论4.数据分析师的技能进阶|0x00 为什么数据分析很重要第一个层面,统计学依旧是数据分析的核心方法。我们先来看一下数据分析的定义:“为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程”,数据分析是基

2021-06-01 20:04:02 579

原创 《增长黑客》启示录

本文是重读《增长黑客》的读书笔记,附带了很多自己的想法。|0x00 为什么“增长黑客”理论会兴起“增长黑客”理论的精髓是什么?是能够通过快节奏的测试和迭代,以极其低的成本来获取并留存用户。这在商业变化很快的互联网时代里,简直就是业务增长的利器,毕竟,作者带着Dropbox实现了500%的增长。增长黑客的一系列方法,打破了传统的企业项目管理方式,将数据、工程、产品与运营团队“捏”在了一起,通过知识的互补,组成了跨领域的高效执行团队。这间接影响了现代互联网公司以“BU制”(Business Unit)来组

2021-05-10 15:36:20 218

原创 解密数据分析

|0x00 数据分析做什么数据分析的定义,在百度百科上是这样介绍的:“用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。”这句话的理解比较费劲,那么简单一点讲,数据分析就是发现有用的信息,提供结论并支持决策。有道是“数据在手,天下我有”,但如何寻找出数据中潜在的价值,就是分析师的重要工作了。数据分析大概有两种不同的发展方向,一种是偏向业务分析,需要对业务有比较深的理解,在此基础上,通过数据来寻找业务增长的套路,例如用户增长、网站分析

2021-05-06 22:00:55 356 2

原创 分布式计算技术

|0x00什么是分布式计算这里我引用知乎上的介绍:“分布式计算(Distributedcomputing)是一种把需要进行大量计算的工程数据分割成小块,由多台计算机分别计算,在上传运算结果后,将结果统一合并得出数据结论的科学。”讲到分布式计算,大多数人第一时间想到的,就是“Hadoop”,它的诞生就是为了解决海量数据的计算问题。Hadoop以谷歌三大论文为蓝本,GoogleFS、MapReduce、BigTable,这三篇论文奠定了大数据算法的基础。但这些论文毕竟是2003年就...

2021-04-28 10:46:44 1486

原创 也谈数据治理

|0x00数据治理是什么数据治理,在不同行业的概念,可能不同。比如在国家标准化管理委员会发布《信息技术服务治理第5部分:数据治理规范》,从非常宏观的角度来制定,侧重于拉通概念和达成共识,像一种“国家标准”;《华为数据之道》是从企业数字化的角度切入下去,侧重数据治理体系和方法论,属于一种“管理方案”;而阿里推出的《大数据之路》一书,则在数据技术层面给出了有价值的指导,算是具体的“实现方案”了。DAMA(国际数据管理协会)给“数据治理”下的定义是:数据治理是对数据资产管理行使权力和控制的活...

2021-04-23 14:18:43 297

原创 分布式协调服务导论

|0x00分布式系统缘何兴起什么是分布式?简单来讲,是将相同或者相关的程序,运行到多台服务器上,实现特定目标的一种方式。从外部的视角来看,一组服务器,展现给用户的是一个统一的整体,使用起来就像单机系统一样。因此,不论是数据的并行计算,或者是任务的并行调度,都是分布式的一种形态,而我们对分布式发展的最主要驱动力量,则来自于对“性能、可用性和可扩展性”的不懈追求。从发展过程上讲,分布式系统经历了单机-并行-分布式三个阶段,以“火车订票系统”为例,我们能够明显感知到这种发展的过程。...

2021-04-20 10:24:01 382

原创 分布式技术提纲

0x00为什么要学习分布式技术在软件工程领域中,我们一直非常喜欢谈论各种加工问题,比如“高并发、高可用、高可靠”,或者是“容器化、微服务、异地多活”,相关的技术细节、框架选型,像一张网一样,让人眼花缭乱。但,“万事万物都有自己的规律”,分布式技术是有纲领可以遵循的,掌握好这个纲领,可以在我们遇到问题时,从容的做出应对。我很喜欢《阴符经》的一句话:“贤者守时,不肖者守命”,当我们在PK方案、晋升答辩的关键时刻,有系统的知识体系为自己撑腰,能够争取来更大的机会。0x01分布式技...

2021-04-15 14:34:58 109

原创 碎碎念念聊中台

|0x00 中台诞生的初衷日常工作中,我们最常听到的抱怨就是:“人不够…” 而解决资源不足的方法,最简单暴力的,就是增加人力,靠堆人力来解决问题。我们要承认,大多数情况下,增加人力确实能解决资源不足的问题,但组织的协作效率、研发效能,却并没有因此而得到改善。随着时间推移,代码成本增加,维护原有的代码又需要增加人力,从而陷入到一种无休无止的境地,直到业务停掉。《人月神话》中,作者花费了比较大的篇幅来阐述项目延期的最主要原因,是:“缺乏合理的进度安排”,而“向进度落后的项目追加人力,只会使进度更加落后”。因

2021-04-09 09:05:17 259 2

原创 浅谈数据埋点

### |0x00 如何理解埋点埋点是数据采集的专用术语,在数据驱动型业务中,如营销策略、产品迭代、业务分析、用户画像等,都依赖于数据提供决策支持,希望通过数据来捕捉特定的用户行为,如按钮点击量、阅读时长等统计信息。因此,数据埋点可以简单理解为:针对特定业务场景进行数据采集和上报的技术方案。数据埋点非常看重两件事,一个是数据记录的准确性,另一个则是数据记录的完备性。先讲数据的准确性。数据埋点非常强调规范和流程,因为参数的规范与合法,将直接影响到数据分析的准确性,如果准确性得不到保障,那么所有基于

2021-04-05 17:40:00 404

原创 系统的设计一个指标体系

|0x00 如何理解指标体系讲道理,虽然今天互联网企业已经足够的数字化,但看清楚公司的运行情况,依旧是一件很难的事情。看清楚,不仅包括看清楚企业的投入情况,也包括看清楚业务的运行情况。比如,投入了几百万的预算,带回来多少DAU的增长?这其中每个阶段的转化情况怎么样?1/7/30天后留存的有多少?本次活动各个渠道的质量如何评估?当下的互联网企业,很多决策可以说是“无数据不决策”,不论是运营对活动效果的分析,还是高层对商业走势的判断,没有成熟的分析看板,临时做需求是接不住的。但本文,要讲述的,是数据看板的

2021-03-29 20:43:46 967

原创 如何从0到1建设一个数据平台

### |0x00 战略篇为什么会写这篇文章?是因为做了一段时间的企业数字化工作,发觉不是所有的地方,都已经做好了一个数据平台,等你来大展身手。更多的时候,你是来到了一片荒漠之中,把过去那些已经做的比较成熟的事情,重新的再做一遍,就像游戏开荒那样。因此,如果快速度过0-1的过程,从1开始发挥自己的价值,就显得很有必要,这是一个战略问题。其实,数据在没有积累到一定程度时,是很难发挥出它的智能价值的,也就是数据平台的发展,绕不过“看数”的阶段。只要业务成熟到一定程度,数据才能发挥出它的增值潜力。就像石油

2021-03-22 21:54:09 278

原创 数据看板的搭建思路

|0x00 谁在用数据看板我们在讲一件事情之前,首先要问自己两个问题:第一,这个东西的作用是什么;第二,这个东西是给谁用的。譬如报表,大家的想法,很自然的会认为,这是给高管或投资人看的。但,素有“中国巴菲特”之称的段永平,在谈到自己的投资经验时,会说他几乎从来不看报表,如果真的想了解,会请专业人士看完,给他一个结论。因为,看报表只是了解一家公司的入口,更像是诊断指标的化验单,医生可以用它作为参考的依据,但它毕竟不是诊断结果。所以,数据看板的作用,应该是给专业人士用的、用于呈现公司业务数据的表

2021-03-17 09:49:17 2079

原创 数据研发的岗位技能

脉脉有个讨论,结合看更有意思:【点击此处】|0x00 开局一张图|0x01 如何理解数据研发岗数据研发,又名“大数据开发”、“数据仓库”、“数据技术”等称呼,通常的岗位要求是熟悉数据仓库模型设计经验、熟练运用大数据计算平台、有良好的数据敏感度、具备数据统计的基础知识等要求。提炼一下,就是掌握全面的数据技术知识,具备与工程、数据、分析/算法、产品/运营,同时打交道的能力,是一个入门门槛低,但成长难度大的岗位。对标金融,就是从会计到CFO,从行业分析到基金经理的成长难度。作为从12年就开始搞数据开发

2021-03-10 19:13:59 484

原创 深入谈谈企业数字化

### |0x00 如何理解企业数字化数字化转型,是这几年很热门的一个词,虽然“数字化”很热,但想了解数字化、知道企业在转什么、以及如何转型升级,核心在于理解数字化的对立面是什么。只有明确了一件事情的对立面,才能明确这件事情的价值。就“数字化”而言,个人理解,它的对立面是“经验化”。就企业而言,过去企业管理虽然有制度,但不论是制度怎么定、还是制度怎么落,核心都在人上,重点都在中层管理者上。所以我们对于管理者的期许,往往是一些从业很多年、见过世面的人,因为只有经历的多了、看得多了,对一些棘手的事情

2021-03-05 15:52:10 210

原创 这个数据的时代:漫谈数据驱动

“本文从非常宏观的视角来阐述数据价值。”欢迎关注公众号:晓阳的数据小站|0x00 数据驱动的本质什么是数据?在大多数人的看法中,只有“数字”才能称之为“数据”,或者是必须由数字来组成的东西,其实不然。数据的概念要比数字大的多,例如在互联网上,不论是我们看过的新闻(文本)、朋友圈的动态(图片)还是正在追的电视剧(视频),这些都是数据。更加广义一些,医院中的诊疗档案、建筑工人使用的图纸,这些也都称之为数据。讲到数据,又不能不提到“信息”。刚才提到的那些内容,本质上也是信息,所以“数据” = “信息”。但

2021-02-25 20:41:51 492

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除