自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

微信搜:import_bigdata,大数据领域硬核原创作者

GitHub搜:https://github.com/wangzhiwubigdata/God-Of-BigData

  • 博客(19)
  • 资源 (1)
  • 收藏
  • 关注

转载 华为数据治理及数据分类管理实践

点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源 节选自《华为数据之道》 作为一家巨型跨国企业,华为在 170 多个国家同时开展各种业态的业务,华为的数据底座...

2021-06-29 21:57:31 555

原创 【面试&个人成长】2021年过半,社招和校招的经验之谈

点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源长话短说。今天有点晚,因为一些事情耽误了,文章发出来有些晚。周末的时候和一个知识星球的读者1对1指导了一些应届生的学习路径和简历准...

2021-06-28 23:16:50 371

原创 Data Mesh,数据网格的道与术

点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源周末的时候,看到有群友讨论关于 Data Mesh 的话题。这个名词我在2020年初的时候听到过一次,当时感觉就是一个概念,看的糊...

2021-06-26 18:47:57 855

原创 大数据面试通关手册|Hbase面试题(二)

⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339⭐⭐欢迎点赞 👍 收藏 ⭐留言 📝 ,欢迎留言交流!⭐⭐本文由【王知无】原创,首发于 CSDN博客!⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!技术背景起源于谷歌旧三篇论文中bigtable。设计目的为了解决大数据环境中海量结构化数据的实时读写问题。为了弥补hadoop生态中没有实时存储的缺陷。设计思想分布式技术本质 概念:分布式列存储nosql数据库 解..

2021-06-24 08:30:00 554

原创 ElasticSearch 双数据中心建设在新网银行的实践

点击上方蓝色字体,选择“设为星标”回复”资源“获取更多惊喜本文公众号读者飞熊的投稿,本文主要讲述了ElasticSearch 双数据中心建设在新网银行的实践。作者简介:飞熊,目前就职于新...

2021-06-22 07:15:11 753 2

原创 大数据面试通关手册 | Kylin入门/原理/调优/OLAP解决方案和行业典型应用

点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源【硬刚系列】是针对某一个框架/知识点进行的系统性总结和学习,基本上也是个人学习的必要路径。个人会从一个框架/知识点入手进行全方位的...

2021-06-22 07:15:11 1055

原创 大数据面试通关手册|数据仓库面试题(四)

⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339⭐⭐欢迎点赞 👍 收藏 ⭐留言 📝 ,欢迎留言交流!⭐⭐本文由【王知无】原创,首发于 CSDN博客!⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!数据仓库的定义?首先,用于支持决策,面向分析型数据处理;其次,对多个异构的数据源有效集成,集成后按照主题进行重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。数据仓库(Data Warehouse)是一个面向主题的(subject o..

2021-06-20 20:29:37 846

原创 大数据面试通关手册|Hbase面试题(一)

⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339⭐⭐欢迎点赞 👍 收藏 ⭐留言 📝 ,欢迎留言交流!⭐⭐本文由【王知无】原创,首发于 CSDN博客!⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!1.Hbase调优HBase高可用在HBase中Hmaster负责监控RegionServer的生命周期,均衡RegionServer的负载,如果Hmaster挂掉了,那么整个HBase集群将陷入不健康的状态,此时的工作状态并不会维持太久。所以需要配置.

2021-06-19 12:44:11 463

原创 大数据面试通关手册|数据仓库面试题(三)

⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339⭐⭐欢迎点赞 👍 收藏 ⭐留言 📝 ,欢迎留言交流!⭐⭐本文由【王知无】原创,首发于 CSDN博客!⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!38.数据质量,元数据管理,指标体系建设,数据驱动数据质量基本概念数据质量管理(Data Quality Management),是指对数据从计划、获取、存储、共享、维护、应用、消亡生命周期的每个阶段里可能引发的各类数据质量问题,进行识别、度量、监控.

2021-06-19 12:35:38 469

原创 大数据面试通关手册|数据仓库面试题(二)

26.全量表(df),增量表(di),追加表(da),拉链表(dz)的区别及使用场景全量表:每天的所有的最新状态的数据。1、全量表,有无变化,都要报;2、每次上报的数据都是所有的数据(变化的 + 没有变化的)9月10号全量抽取到ods层create table wedw_ods.order_info_20200910( order_id string COMMENT '订单id',order_status string COMMENT '订单状态',create_time

2021-06-19 12:30:04 720

原创 大数据面试通关手册|Hadoop面试题(一)

1、Flume使用场景线上数据一般主要是落地(存储到磁盘)或者通过socket传输给另外一个系统,这种情况下,你很难推动线上应用或服务去修改接口,实现直接向kafka里写数据,这时候你可能就需要flume这样的系统帮你去做传输。2、Flume丢包问题单机upd的flume source的配置,100+M/s数据量,10w qps flume就开始大量丢包,因此很多公司在搭建系统时,抛弃了Flume,自己研发传输系统,但是往往会参考Flume的Source-Channel-Sink模式。一些公司在Fl

2021-06-19 12:26:08 403

原创 大数据面试通关手册 | Presto原理&调优&面试&实战

点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源很久之前,曾经写过一篇 《Presto在大数据领域的实践和探索》。文中详细讲解了Presto的原理和应用。今天这篇文章是升级版本...

2021-06-17 08:20:00 684

原创 Apache Iceberg技术调研&在各大公司的实践应用大总结

点击上方蓝色字体,选择“设为星标”回复”资源“获取更多惊喜作者在实际工作中调研了Iceberg的一些优缺点和在各大厂的应用,总结在下面。希望能给大家带来一些启示。随着大数据存储和处理需求越...

2021-06-16 08:29:00 1087

原创 标签体系下的用户画像建设小指南

点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源一、 什么是用户画像用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。通俗说就是给用户打标...

2021-06-10 20:53:22 1183

原创 大数据面试通关手册 | ClickHouse基础&实践&调优全视角解析

点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源我们在之前的文章中提到过ClickHouse:《腾讯基于Flink+ClickHouse的实时数据系统实践》《来自俄罗斯的凶猛彪悍...

2021-06-09 08:15:00 1991

原创 大数据面试通关手册 | 数据仓库体系建模&实施&注意事项面试题

点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源什么是数仓从字面上来看,数据仓库就是一个存放数据的仓库,它里面存放了各种各样的数据,而这些数据需要按照一些结构、规则来组织和存放。...

2021-06-06 21:15:11 601

原创 大数据面试通关手册|Spark面试题(四)

⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339⭐⭐欢迎点赞 👍 收藏 ⭐留言 📝 ,欢迎留言交流!⭐⭐本文由【王知无】原创,首发于 CSDN博客!⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!1、spark的有几种部署模式,每种模式特点?1)本地模式   Spark不一定非要跑在hadoop集群,可以在本地,起多个线程的方式来指定。将Spark应用以多线程的方式直接运行在本地,一般都是为了方便调试,本地模式分三类   local:只启动一..

2021-06-04 08:30:00 537

转载 360度无死角 | Pulsar与Kafka对比全解析

点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源2020 年,Pulsar 受到持续关注,Pulsar 的应用场景也越来越广泛。本文分别从性能、架构和功能方面比较 Pulsar ...

2021-06-03 08:15:00 2694

转载 Flink SQL空闲状态保留时间实现原理

点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源前言如果要列举Flink SQL新手有可能犯的错误,笔者认为其中之一就是忘记设置空闲状态保留时间导致状态爆炸。为什么要设置如果我们...

2021-06-01 09:00:00 469

大数据面试大总结300页.zip

大数据面试大总结300页.zip

2021-07-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除