大数据
文章平均质量分 88
匆匆z2
没有银弹
展开
-
Kafka producer写入优化
目录提出需求环境信息测试系统,寻找问题Kafka producer 写入原理Producer 参数ACKS 参数Producer send 方法调用结果Note参考文献 提出需求 由于线上的接口是暴露给外部用户使用,外部用户付费接入,产品经理提出了需求,需要在公司内部做重新数据清洗的时候尽量减少对外部用户数据更新的影响,当前更新数据需要耗费24个小时左右,产品经理提出12小时是可接受的,于是针对当前的调用链路逐一排查,寻找问题. 环境信息 所有服务基于AWS公有云部署, producer部署在ECS上 1C原创 2022-02-21 23:10:23 · 1492 阅读 · 0 评论 -
Alluxio2.X简要介绍
本文基于将alluxio 2.X集成到大数据发行版的经验,从各个方面介绍alluxio 什么是alluxio? alluxio是一个以内存为中心的分布式虚拟存储系统 为什么需要alluxio? 借用官网的一张图来说明 最主要有两点功能: 在数据分析系统和底层存储之间架起桥梁,alluxio像胶水一样,将不同的底层存储用统一的接口统一暴露给上层的计算引擎,起到了一个文件系统gateway的作用 内存优先的分布式架构,领先其他方案数量级的差别,alluxio支持多级缓存,优先使用内存缓存,同时也可以设置ss原创 2020-06-11 21:59:44 · 356 阅读 · 0 评论