自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 论坛 (1)

转载 【好书推荐:第四期】好友的第二本书:《对比Excel,轻松学SQL数据分析》

如果让居士推荐一项数据分析最需要掌握的技能是什么,那居士一定推荐SQL,这一点在《数据团队思考:数据人的通用技能要求》一文中也给大家分享过。但是,很多写SQL的书并不是从数据分析的角度去...

2020-05-31 16:33:46 382

原创 数据百问系列:学习数据仓库该看什么书?

0x00 前言关于数据仓库书的问题被太多小伙伴问到了,因此,即使本文已经发过好几次了,依旧要在数据百问系列中再次发一遍。已经看过本文的小伙伴可以不用再看了。在我们十多个数据交流群中,大家...

2020-05-30 15:00:00 319

转载 美大VS阿里,本地生活的战争要结束了吗?

—1—年初写的那篇《新美大和阿里本地生活的竞争趋势是如何的?》,后来被潘乱老师引用了下,给拉了不少关注度,现在回看难免还是逃不开视角的绝显...

2020-05-29 08:00:00 237

转载 原创的《Python之路实战40篇》PDF高清版,限时下载!

内容简介1《Python之路40篇实战 .pdf》包含Python篇、数据分析篇、机器学习篇等3大模块,目录如下:下载方式2关注公众号「Python与算法社区」,后台回复一个数字「1...

2020-05-29 08:00:00 348

转载 数据运营系列(三):熵权法如何确定指标权重构建评价体系

1.熵权法信息论基本原理解释信息是系统有序性的度量单位,而熵可以度量系统的无序程度;如果某个指标的信息熵越小,该指标提供的信息量越大,指标变异程度(方差)高,因此在综合评价中所起作用理...

2020-05-29 08:00:00 550

原创 数据百问系列:是一个宽表好还是多个维表好?

0x00 前言本篇的主题是关于数据模型的规范化和反规范化的讨论,其实也是一种常见的维度建模的设计和业务使用便捷性的冲突。问题:在设计数据表的时候,是一个宽表好,还是多个维度表好?0x01...

2020-05-28 10:26:16 256

转载 数据运营系列(二):如何用合成控制法判断策略实施效果

1.合成控制法合成控制法最开始是经济学家用来研究评估某个政策实施在某国家或地区的效果,原理即是反事实框架,假想该地区没有受政策干预会怎样,并与事实上受到干预的结果做对比。二者之差即为“...

2020-05-27 21:16:00 175

转载 【收藏】SQL经典面试50题 | 附答案

今天给大家分享一份星友对SQL经典面试50题的刷题记录,稍作了一些修改,以下是星友自述正文:看完了SQL基础教程,然后再看SQL进阶教程感觉有些不是很懂,于是就开始刷题熟悉⼀下基础知识...

2020-05-26 08:02:00 129

转载 数据运营系列(一):生存分析与用户行为如何联系起来

1.生存分析生存分析主要用于医学研究,比如医疗方案对病人寿命的影响。后面用来探究所感兴趣的事件的发生的时间的统计方法。比如产品的寿命分析、工程中的失败时间分析等等。这里病人死亡、产品淘...

2020-05-25 22:40:00 180

转载 学 Python 必看书单汇总

学 Python 看什么书?这是刚接触 Python 的朋友最疑惑的问题。今天就结合自己入门时的学习历程和大家来聊一聊如何入门 Python,为了更有说服性一些,这里我把入门时看过的一些...

2020-05-23 10:02:00 120

转载 【实践案例分享】菜鸟实时数仓技术架构演进

分享嘉宾:贾元乔 菜鸟高级数据技术专家编辑整理:夏飞飞内容来源:Flink Forward ASIA出品平台:DataFunTalk导读:在开源盛世的今天,实时数仓的建设已经有了较为成...

2020-05-21 08:00:00 204

转载 数据产品到底是干什么的?

在上篇文章“你的团队可能缺了一个数据产品经理!”后,有读者问:"数据产品是什么?数据经理是干嘛的?和业务产品经理的差别是什么?"所以这篇文章将就这个话题展开,内容分3部分...

2020-05-20 08:00:00 454

转载 【收藏】它绝对是最适合自学的Python教材!

《Python Data Science Handbook》是一本非常值得推荐和学习的Python教材,深受很多初学者和大佬的喜爱,并且获得豆瓣9.3分的好成绩。该书原作者是美国华盛顿大...

2020-05-19 07:47:28 227

转载 【实践案例分享】OPPO 实时数仓揭秘:从顶层设计实现离线与实时的平滑迁移...

摘要:单日总数据处理量超 10 万亿,峰值大概超过每秒 3 亿,OPPO 大数据平台研发负责人张俊揭秘 OPPO 基于 Apache Flink 构建实时数仓的实践,内容分为以下四个方面...

2020-05-19 07:47:28 190

转载 实战中,需求优先级怎么定

走过路过不要错过点击蓝字关注我们时光荏苒,转眼间来滴滴已经10个月了。十个月里也是受益匪浅。除了完成了19年入职之初迫切渴望的实打实做出来一些“数据驱动业务增长”的事情,还承蒙老板和对接...

2020-05-18 08:27:00 245

转载 新美大和阿里本地生活的竞争趋势是如何的?

上半年的时候,跟两位BA大厂VP级的老大哥聊起本地生活的业务,赶上最近阿里本地生活开了「商业操作系统」的发布会,正好规整下当时的一些判断,记录下来,当然我们说的也不一定对。本地生活这场仗...

2020-05-16 08:00:00 401

转载 浅谈实时数据开发

浅谈实时数据开发(一)技术路线图(二)典型应用场景电商平台大促期间成交金额;广告主实时报表(分钟级更新);实时反作弊;业务场景异常监控。(三)流式技术架构目前流式计算框架相对成熟,以St...

2020-05-15 08:02:00 226

转载 学习统计学必须掌握的几个核心概念

作者介绍@大师兄混迹数据江湖十余载。主要负责大数据商业变现和产品运营工作。“在终极的分析中,一切知识都是历史;在抽象的意义下,一切科学都是数学;在理性的基础上,所有的判断都是统计学。”...

2020-05-14 08:00:00 300

转载 知乎超高的12K赞回答!Java学到什么程度才能叫精通?

乔戈里是我的朋友,目前某BAT大厂工作,他在知乎上收获12K赞的Java面试手册(这赞数,质量多高就不用我多说了吧)非常全面,包涵Java基础、Java集合、JavaWeb、操作系统、计...

2020-05-14 08:00:00 315

原创 数据百问系列:数仓团队如何在繁重的需求中体现自己的价值?

数据百问系列:数仓团队如何在繁重的需求中体现自己的价值?0x00 前言本话题来自于群友罗丽叶在数据中台群中的提问:如何让数仓团队在繁重业务数据需求的情况下,依旧能熟悉业务和数据,进而为业...

2020-05-13 00:01:51 226

转载 认知环境,环境对产品的影响无孔不入

本文由菩提创作,本文仅菩提个人观点。一. 开 篇朋友问:“在互联网公司这么久,怎么撑下来的?”Hmm,糟心事真不少。成年人的世界,没有人轻轻松松。菩提那老夫聊发少年狂的豪情壮志,时常被...

2020-05-12 12:03:00 209

转载 数据分析的坑,都在统计学里埋过

此文为《赤裸裸的统计学》读后感,结合着一些互联网分析的知识来看,发现很多理念隐隐有互通之处,十分有趣。推荐大家阅读。为什么要了解统计学对于普罗大众来说,统计学应该会成为每人必备的常识,才...

2020-05-10 10:32:10 284

转载 PDF课件下载!《用Python玩转数据》

向大家推荐一个南京大学的公开课——用Python玩转数据授课老师张莉博士是南京大学计算机科学与技术系副教授,主要研究领域为数据挖掘和自然语言处理。张老师上课走亲切风冷幽默路线,跟同学们相...

2020-05-09 09:00:00 246

转载 【数据体系】- 深入浅出数据仓库

p2虾,一个不断自我抗争的人。0x00 前言说起数据仓库,未有了解的人应该会下意识的拆解为数据与仓库这两个词,形成通俗的印象,也就是装载数据的仓库。但是这样的解释难免有失偏颇,若数据仓库...

2020-05-09 09:00:00 196

转载 你的团队可能缺了一个数据产品经理!

数据产品经理今年特别火,市场上大有人鼓吹数据产品经理年收入几十万打底,疫情之下其他岗位收缩,唯数据产品经理独树一帜,不但高薪,还大量扩招。也有资深数据从业者吐槽,产品经理的分类里都没有一...

2020-05-08 18:46:53 178

原创 “浪”的量子力学解释

“浪”的量子力学解释0x00 前言这个五四青年节,小破站的一个《后浪》的视频引爆了两代人的网络论战,“前浪”们感慨,“这届年轻人不好带了!”“后浪”们觉得,“视频就不是真实的世界!”好吧...

2020-05-07 19:07:31 228 1

转载 实时数据架构&实时数据仓库,你到底了解多少?

随着互联网的发展进入下半场,数据的时效性对企业的精细化运营越来越重要, 商场如战场,在每天产生的海量数据中,如何能实时有效的挖掘出有价值的信息, 对企业的决策运营策略调整有很大帮助。此外...

2020-05-06 08:55:37 929

转载 MLSQL系列 1:MLSQL介绍

MLSQL是一门标准的大数据/机器学习语言。MLSQL Engine是执行MLSQL语言的分布式引擎,通过Antlr4(后续文章会讲解)定义和解析MLSQL语法,并翻译为Spark代码,...

2020-05-04 17:26:05 280

原创 数据团队规划布局感悟(二)

0x00 前言 这篇内容承接了第一篇文章《数据团队规划布局感悟(一)》。在前公司的时候,因为同事经验都很丰富,大体都5年+,十年的也不乏其人,所以基本没有所谓管理,而在那个阶段,我更关注...

2020-05-04 17:26:05 166

转载 分享50篇实用数据分析文章

今天给大家推荐一个数据分析&挖掘领域的大牛:徐麟,毕业于哥伦比亚大学,之前在携程、唯品会等互联网公司从事担任高级数据分析师,同时创建了个人公众号数据森麟。数据森麟他在自己的公众号...

2020-05-03 09:46:28 369

转载 数据团队规划布局感悟(一)

前言记得今年一月份在杭州和W君漫步钱塘江赏霾,畅谈了两个小时,除了聊了[研发的两观,全局观和产品观](http://www.jianshu.com/p/339278c26f71), 也聊...

2020-05-02 12:02:11 246

转载 【实践案例分享】Jupyter在美团民宿的应用实践

美团民宿是美团旗下的民宿预定平台,专注为旅行者提供个性化民宿住宿体验,让年轻人“住得不一样”。本文将分享美团民宿团队的「Kaggle Kernels」——一个平台化的Jupyter,接入...

2020-05-01 08:16:46 293

空空如也

木东居士的留言板

发表于 2020-01-02 最后回复 2020-01-02

空空如也
提示
确定要删除当前文章?
取消 删除