etlgr是什么服务器_腾讯云 Serverless ETL —— 蘑菇街实战落地

最新推荐文章于 2024-07-16 23:26:22 发布

泰山的雨久下不停

最新推荐文章于 2024-07-16 23:26:22 发布

阅读量117

点赞数

文章标签： etlgr是什么服务器

本文链接：https://blog.csdn.net/weixin_35457966/article/details/112011343

版权

背景

蘑菇街旨在做一家高科技轻时尚的互联网公司，公司的核心宗旨就是购物与社区的相互结合，为更多消费者提供更有效的购物决策建议。

蘑菇街上每天有几百万网友在这里交流时尚、购物的话题，相互分享，这些行为会产生大量的数据，当这些数据源产生数据后，需要有一个组件获取数据源的数据，将数据写到 kafka，蘑菇街研发团队以往的解决办法，一是通过 Lofstash、Filebeat 等开源的数据存储方案处理，二是自己写代码实现这种逻辑。

开始数据量小的时候还可以，随着业务的不断扩张，数据越来越大，为了保障可用性、可靠性以及性能相关的内容，需要大量的研发资源投入，因此，亟待新的解决方案支持。

CKafka 全称是 Tencent Cloud Kafka ，是一款适合公有云部署、运行、运维的分布式、高可靠、高吞吐和高可扩展的消息队列系统。它 100% 兼容开源的 Kafka API，目前主要支持开源的 0.9, 0.10, 1.1.1, 2.4.2 四个大版本，并提供向下兼容的能力。

目前 Tencent Cloud Kafka 维护了近万节点的集群，堆积数据达到了 PB 级。是一款集成了租户隔离、限流、鉴权、安全、数据监控告警、故障快速切换、跨可用区容灾等等一系列特性的，历经大流量检验的、可靠的公有云上 Kafka 集群。

CKafka 目前服务对象包括拼多多、微信、哔哩哔哩，以及腾讯内部的一些大的应用，包括腾讯视频、微视等。

蘑菇街的选择

蘑菇街团队对比市场上的技术解决方案，从学习成本、扩缩容能力以及人工维护成本和稳定性方面考虑。

腾讯云 Serverless 云函数具有天然的优势：

支持多语言

学习成本低，不需要学习开源方案，不需要学习分布式调度

无限的弹性扩容能力

多重触发方式，事件触发、定时触发、主动触发

集群稳定性和可用性的维护成本几乎没有

按实际用量计费，1ms计费，费用很低

同时，腾讯云 Serverless 云函数+ Ckafka 提供自建的 UI 交互界面，可进行流量告警配置，同时控制台上可进行扩容配置且安全可靠。

腾讯云 Serverless 团队为蘑菇街提供的业务解决方案，是通过云函数将一个实例中某个 Topic 的消息转储至另一个实例对应的 Topic上，对比原来的 Connector 方案，腾讯云云函数 SCF 能够通过腾讯云控制台进行管理，能控制触发阈值，触发开关等，可以很方便地对每个函数进行管理。简单来讲，

消息转储：将 Topic 的消息同步至离线集群

集群迁移：在集群迁移合并的过程中起到一个双写的作用

经过对比，腾讯云 Serverless 云函数 + Ckafka 是最优的解决方案，蘑菇街最终决定选择使用腾讯云 Serverless 云函数 + Ckafka 运用在的消息同步业务上。

腾讯云 Serverless 云函数 + Ckafka 解决方案的优势

Kafka 社区的繁荣，让越来越多的电商用户开始使用 Kafka 来做日志收集、大数据分析、流式数据处理等。而公有云上的产品 Ckafka 也借助了开源社区的力量，和云函数结合，推出了非常实用的功能，其优化点包括：

基于 ApacheKafka 的分布式、高可扩展、高吞吐

100% 兼容 Apache KafkaAPI(0.9 及 0.10)

无需部署，直接使用 Kafka 所有功能

Ckafka 封装所有集群细节，无需用户运维

支持动态升降实例配置，按照需求付费(开发中)

对消息引擎优化，性能比社区最高提升 50%

如下图，云函数可以实时消费 Ckafka 中的消息，比如做数据转存、日志清洗、实时消费等。并且，像数据转存的功能已经集成到了 Ckafka 的控制台上，用户可以一键开启使用，大大降低了用户使用的复杂度。