自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

转载 elasticsearch使用RestHighLevelClient API重建index

elasticsearch 7及6的部分版本建议使用 RestHighLevelClient替代原来的Transport Client API以下是使用rest高阶api实现index重建的过程,主要思路是使用scroll api读取原index中的数据,然后使用BulkProcessor将...

2019-05-29 16:34:00 675

转载 使用docker搭建zabbix

部署zabbix环境所需组件: 1.Mysql 2.Zabbix-server 3. Zabbix-web 4.Zabbix-agent 各组件分布情况: Mysql ,server, web和agent分别部署到不同的节点上(四个节点) 搭建步骤: ...

2018-07-13 14:53:00 135

转载 SequenceFile 读写

SequenceFile 读 public static void main(String[] args) throws IOException { Configuration conf = new Configuration(); FileSystem fs = FileSys...

2016-09-22 13:57:00 188

转载 Hadoop集群搭建最佳实践

摘抄 Bios 调优检查表 检查硬件上所以cpu内核是否得到了充分利用;否则,可以降级cpu频率 启用原生命令排队模式。一般来说,可以通过BIOS中的 advanced host controller interface 选项启用NCQ模式 OS配置建议 选择支持E...

2016-09-20 16:54:00 167

转载 计算MapReduce过程中需要的缓冲区大小

在Map阶段,map函数会产生中间数据输出并保存在内存缓冲区中(缓冲区大小由io.sort.mb参数指定)。一旦达到占用阈值(默认是80%),缓冲区的内容就会写入本地磁盘,这也就是所谓的溢写(spill)。 缓冲区内会存储溢写记录的元数据(每条数据元数据长度为16字节)和溢写记录。 分配给...

2016-09-20 10:52:00 668

转载 Hadoop根据加工数据量计算Datanode数量

根据数据量及Hadoop参数计算Datanode的个数每天加工数据量:100GB复制因子:3月增长量:5%MapReduce中间数据:25%非HDFS空间:30%节点磁盘空间:4T计算方法:每天存储数据量所需要空间 = 每天加工数据量 x 复制因子 = 300GB每月数...

2016-09-19 16:51:00 679

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除