自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

玉皇大帝不开心

欢迎关注“数据仓库与Python大数据”公众号(ID: iom1128)

  • 博客(15)
  • 收藏
  • 关注

转载 漫画:什么是数据仓库?

一个故事在很久很久以前,世界上生活着许多种族,有人类,有矮人,有精灵......他们有着不同的信仰,不同的文化,彼此相安无事。可是,有一个猥琐男却偏偏想要统治整个世界。如...

2019-10-21 17:00:00 399

转载 BI, 数据仓库,ETL, 数据开发,有什么区别?

BI: Business Intelligence.为商业提供一切智能化操作,判断与管理的手段,都可以归拢到 BI 范畴。即便是 AI (Artificial Intel...

2019-10-20 21:17:40 3955

转载 系列 | 实时数仓实践第二篇NO.2『数据质量』

点击上方蓝色字体,置顶/星标哦目前10000+人已关注加入我们 作者author诸葛子房,现就职于一线互联网公司,中国Hbase技术社区委员,从事大数据相关工作。了解互...

2019-10-20 21:17:40 616

原创 最新中台架构PPT,一起欣赏6大互联网大厂的架构图

直奔主题 大厂中台架构PPT1菜鸟数据中台技术演进之路陈飞-菜鸟高级技术专家,11年-16年阿里巴巴数据应用部从事大数据风控决策系统,全球企业信息库 ToB产品,16年至...

2019-10-20 21:17:40 6186

转载 系列 | 实时数仓实践第一篇NO.1『宽表处理』

点击上方蓝色字体,置顶/星标哦目前10000+人已关注加入我们 作者author诸葛子房,目前就职于一线互联网公司,中国Hbase技术社区委员,从事大数据相关工作。了解...

2019-10-18 08:08:00 1227

转载 一道SQL题的前世今生

来看一道SQL题目:注:以下讨论核心在于解释原理,所涉及到的数据和表结构均为虚构。本文代码较多,如果看不清楚,可以在后台回复“SQL”获取本文PDF版本。假设某APP场景...

2019-10-18 08:08:00 287

转载 Lambda架构已死,去ETL化的IOTA才是未来

经过这么多年的发展,已经从大数据1.0的BI/Datawarehouse时代,经过大数据2.0的Web/APP过渡,进入到了IOT的大数据3.0时代,而随之而来的是数据架...

2019-10-16 00:08:08 353

原创 记一次 蚂蚁金服 数据仓库 岗位面试经历

导读:本文将带你一起走进蚂蚁金服大数据数仓面试。文末加群,即有机会与作者『潇傲江湖』群内沟通,高手对决。蚂蚁金服大数据数仓岗位的面试经历一、前言本人一直在外企做传统数仓也差不多十年了,技术栈都是以关系型数据库和商业工具为主。看着日新月异的大数据技术的发展和数仓架构的不断迭代,想跳到互联网企业看看去接触新的业务和技术栈。今年...

2019-10-15 00:04:13 4334

原创 大数据、数仓成神之路,冲击30k就靠它了!(送书福利)

点击上方蓝色字体,置顶/星标哦目前10000+人已关注加入我们Oct 11♪说两句Qian Yan乌云蔽月,人迹踪绝,大数据成神之路金九银十,很多朋友在后台/微信问我,...

2019-10-11 00:27:36 586 1

转载 我所理解的互联网BI数据分析师 | 全面解读(建议收藏)

本文目录:☞ 数据分析师的工作内容☞数据分析师的能力要求☞数据分析与数据挖掘☞数据分析师的困境☞数据分析师的推荐资料☞总结数据分析师虽然是很多互联网公司都设立的...

2019-10-10 08:08:00 5175

转载 直击面试 | 一文搞懂大数据、数仓面试必问之『数据倾斜』(建议收藏)

???? Index什么是数据倾斜数据倾斜的原因Hadoop计算框架的特点优化的常用手段优化案例???? 什么是数据倾斜我们在用hive取数的时候,有的时候只是跑一个简单的join语...

2019-10-08 19:55:11 1063

转载 记一次蚂蚁金服的面试经历

2015在实习的时候,当时一个一起实习的朋友在2019年3月份的时候突然在微信上找我,问我要不要面试下蚂蚁金服。问了下相关信息才知道他在2018年11月的时候进到蚂蚁金服...

2019-10-07 23:32:03 364

转载 秒懂Flink状态State-深度解读(上)『建议收藏』

目录☆☞Overview(概述)☆☞Working with State(带状态的工作)☆☞The Broadcast State Pattern(广播状态模...

2019-10-06 10:30:00 10490 2

转载 基于 Apache Kylin 的微博舆情实时分析(内含 Demo)

通过 Real-time OLAP,Kylin v3.0 能够对接 Kafka 数据源,并且实现秒级的数据查询延迟。从 v3.0.0-alpha 发布到现在,世界范围内已...

2019-10-03 09:10:00 245

转载 数据平台建设整体思路阐述和总结

数据工作的理解数据的每一次的输出,永远不会有bug,只有对和错。数据人永远是在怀疑和被怀疑,孤独和寂寞中完成。每次的输出可能只有一个数字,概率,猜测。。。但是其背后可能是...

2019-10-03 09:10:00 510

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除