自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Focus on Lakehouse

公众号@大数据技术架构

  • 博客(8)
  • 收藏
  • 关注

转载 别再说你不会 ElasticSearch 调优了,都给你整理好了

来源:http://tinyurl.com/y4gnzbje第一部分:调优索引速度第二部分-调优搜索速度第三部分:通用的一些建议英文原文:https://www.elas...

2019-08-29 08:14:37 214

原创 大数据正当时,理解这几个术语很重要

目前,大数据的流行程度远超于我们的想象,无论是在云计算、物联网还是在人工智能领域都离不开大数据的支撑。那么大数据领域里有哪些基本概念或技术术语呢?今天我们就来聊聊那些避不开的大数据技术术语,梳理并补充我们对大数据的理解。01离线计算 Vs 实时计算离线计算离线计算,通常也称为“批处理”,表示那些离线批量、延时较高的静态数据处理过程。离线计算适用于实时...

2019-08-21 19:15:31 1633

原创 Spark 内存模型与动态内存管理

0、前 言Apache Spark是目前大数据领域主流的内存计算引擎,无论是在批处理还是实时流处理方面都有着广泛的应用。我们跑作业的时候,首先要给Spark Job分配一定的资源,比如一个executor分配5G内存,有时候我们会纠结于executor的内存有多少用于了实际计算。因此就需要了解一下Spark的内存管理,还有就是掌握了Spark的内存模型对于优化我们的作业也至关重要。在Spa...

2019-08-19 19:01:00 650

原创 鸿蒙出世,华为的终极浪漫

8 月 9 日,华为举行了有史以来规模最大的全球开发者大会,正式发布开源了自主研发的全新分布式操作系统——鸿蒙(HarmonyOS)。鸿蒙一经出世,便带来了超凡影响。&l...

2019-08-10 11:00:06 108

原创 盘点Zookeeper在分布式架构中的应用

欢迎订阅**微信公众号:大数据技术架构,更多大数据基础架构,原理与实践,社区动态等。近日了解到 Kafka 正在酝酿重大更新,可能会提供自管理的元数据仲裁机制以消除对 Zookeeper 的依赖,社区呼吁也相当强烈。那么一般而言 Zookeeper 在分布式系统中扮演什么角色?目前 Zookeeper 都应用在哪些分布式架构中?本文从 Zookeeper 可以聊起,盘点那些离不开 Zo...

2019-08-09 11:32:47 986

转载 全文搜索引擎Elasticsearch,这篇文章给讲透了

由于近期在公司内部做了一次分享,所以本篇主要是基于之前的博文的一个总结,希望通过这篇文章能让读者大致了解Elasticsearch是做什么的以及它的使用和基本原理。生活中...

2019-08-09 08:21:33 564

转载 分布式系统如何保证一致性

本文源自新浪云计算,作者 Guan分布式一致性算法概要随着各种高并发访问、海量数据处理等应用场景越来越多,为了应对这些使用场景,分布式系统应运而生。分布式系统得以发展,得...

2019-08-06 08:18:43 511

转载 kafka篇-设计思路

戳蓝字“大数据手稿笔记”关注我们哦!本文转自 lecury 的博客:https://blog.lecury.cn1. 设计背景许多互联网公司,每天都会产生大量的日志数据,...

2019-08-03 10:29:38 215

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除