大数据从业人员必要技能之Kafka，面试字节跳动的大数据开发工程师该怎么准备

最新推荐文章于 2024-07-08 14:25:36 发布

2301_79099378

最新推荐文章于 2024-07-08 14:25:36 发布

阅读量592

点赞数 14

分类专栏：程序员文章标签：大数据 kafka 面试

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_79099378/article/details/137727952

版权

程序员专栏收录该内容

30 篇文章 0 订阅

订阅专栏

import java.util.Properties;

import java.util.concurrent.Future;

import org.apache.kafka.clients.producer.Callback;

import org.apache.kafka.clients.producer.KafkaProducer;

import org.apache.kafka.clients.producer.ProducerConfig;

import org.apache.kafka.clients.producer.ProducerRecord;

import org.apache.kafka.clients.producer.RecordMetadata;

import org.apache.kafka.common.serialization.StringSerializer;

public class Producer {

public static void main(String[] args) {

Properties properties = new Properties();

// bootstrap.servers kafka集群地址 host1:port1,host2:port2 …

properties.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG, “127.0.0.1:9092”);

// key.deserializer 消息key序列化方式

properties.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, StringSerializer.class.getName());

// value.deserializer 消息体序列化方式

properties.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG, StringSerializer.class.getName());

KafkaProducer<String, String> producer = new KafkaProducer<>(properties);

// 0 异步发送消息

for (int i = 0; i < 10; i++) {

String data = “async :” + i;

// 发送消息

producer.send(new ProducerRecord<>(“demo-topic”, data));

}

// 1 同步发送消息调用get()阻塞返回结果

for (int i = 0; i < 10; i++) {

String data = "sync : " + i;

try {

// 发送消息

Future send = producer.send(new ProducerRecord<>(“demo-topic”, data));

RecordMetadata recordMetadata = send.get();

System.out.println(recordMetadata);

} catch (Exception e) {

e.printStackTrace();

}

}

// 2 异步发送消息回调callback()

for (int i = 0; i < 10; i++) {

String data = "callback : " + i;

// 发送消息

producer.send(new ProducerRecord<>(“demo-topic”, data), new Callback() {

@Override

public void onCompletion(RecordMetadata metadata, Exception exception) {

// 发送消息的回调

if (exception != null) {

exception.printStackTrace();

} else {

System.out.println(metadata);

}

}

});

}

producer.close();

}

}

Consumer端demo代码：

package kafka;

import org.apache.kafka.clients.consumer.ConsumerConfig;

import org.apache.kafka.clients.consumer.ConsumerRecord;

import org.apache.kafka.clients.consumer.ConsumerRecords;

import org.apache.kafka.clients.consumer.KafkaConsumer;

import org.apache.kafka.common.serialization.StringDeserializer;

import java.time.Duration;

import java.util.Arrays;

import java.util.Properties;

public class Consumer {

public static void main(String[] args) {

Properties properties = new Properties();

//bootstrap.servers kafka集群地址 host1:port1,host2:port2 …

properties.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, “127.0.0.1:9092”);

// key.deserializer 消息key序列化方式

properties.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class.getName());

// value.deserializer 消息体序列化方式

properties.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class.getName());

// group.id 消费组id

properties.put(ConsumerConfig.GROUP_ID_CONFIG, “demo-group”);

// enable.auto.commit 设置自动提交offset

properties.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG, true);

// auto.offset.reset

properties.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, “earliest”);

KafkaConsumer<String, String> consumer = new KafkaConsumer<>(properties);

String[] topics = new String[]{“demo-topic”};

consumer.subscribe(Arrays.asList(topics));

while (true) {

ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));

for (ConsumerRecord<String, String> record : records) {

System.out.println(record);

}

}

}

}

Libkafka examples：

https://github.com/edenhill/librdkafka/tree/master/examples

可能会用到Python的kafka客户端：

https://github.com/Parsely/pykafka

安装pykafka客户端模块

$ pip install pykafka

初始化客户端对象

from pykafka import KafkaClient

client = KafkaClient(hosts=“127.0.0.1:9092,127.0.0.1:9093,…”)

TLS（https连接）

from pykafka import KafkaClient, SslConfig

config = SslConfig(cafile=‘/your/ca.cert’,

… certfile=‘/your/client.cert’, # optional

… keyfile=‘/your/client.key’, # optional

… password=‘unlock my client key please’) # optional

client = KafkaClient(hosts=“127.0.0.1:,…”,

… ssl_config=config)

监听topic

client.topics

topic = client.topics[‘my.test’]

往topic发送消息，这里是同步发送的，需要等待消息确认才能发送下一条

with topic.get_sync_producer() as producer:

… for i in range(4):

… producer.produce('test message ’ + str(i ** 2))

为了提高吞吐量，推荐Producer采用异步发送消息模式，produce()函数被调用后会立即返回

with topic.get_producer(delivery_reports=True) as producer:

… count = 0

… while True:

… count += 1

自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。

深知大多数大数据工程师，想要提升技能，往往是自己摸索成长或者是报班学习，但对于培训机构动则几千的学费，着实压力不小。自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年大数据全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，基本涵盖了95%以上大数据开发知识点，真正体系化！

由于文件比较大，这里只是将部分目录大纲截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且后续会持续更新

如果你觉得这些内容对你有帮助，可以添加VX：vip204888 （备注大数据获取）

一个人可以走的很快，但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎扫码加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

g-VYmB0Rcg-1713020319156)]

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，基本涵盖了95%以上大数据开发知识点，真正体系化！

由于文件比较大，这里只是将部分目录大纲截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且后续会持续更新

如果你觉得这些内容对你有帮助，可以添加VX：vip204888 （备注大数据获取）
[外链图片转存中…(img-7Fj91VQE-1713020319157)]

一个人可以走的很快，但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎扫码加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

关注

14
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
大数据从业人员必要技能之Kafka，面试字节跳动的大数据开发工程师该怎么准备

/ bootstrap.servers kafka集群地址 host1:port1,host2:port2 …//bootstrap.servers kafka集群地址 host1:port1,host2:port2 …// key.deserializer 消息key序列化方式。// value.deserializer 消息体序列化方式。// key.deserializer 消息key序列化方式。// value.deserializer 消息体序列化方式。// 发送消息的回调。
复制链接

扫一扫

专栏目录

普通网友 CSDN认证博客专家 CSDN认证企业博客

码龄1年

98: 原创

-: 周排名

-: 总排名

7万+: 访问

: 等级

2775: 积分

1130: 粉丝

1540: 获赞

11: 评论

1483: 收藏

私信

关注

热门文章

分类专栏

2024年程序员学习 68篇
程序员 30篇

最新评论

ZooKeeper技术细节_zookeeper and 服务器 and 客户端 and 数据节点(1)
ha_lydms: 这篇博客的内容总是能够触动我的内心深处，让我对于人生有了更深层次的体验。
Linux操作系统与Windows文件互传(FTP)，2024年最新我的头条面试经历分享
CSDN-Ada助手: 恭喜您撰写了第12篇博客，内容涵盖了Linux操作系统与Windows文件互传的FTP方法，以及2024年最新的头条面试经历分享。您的文章内容丰富多彩，展现了您对技术和求职经验的深刻理解。在此基础上，建议您可以继续深挖Linux与Windows系统的其他互操作性问题，或者分享更多面试经验中的技巧和心得，让读者受益匪浅。希望您能继续保持创作热情，不断提升自我，期待您更多精彩的作品呈现！
linux操作系统安装及命令初识，Linux运维程序员必备
CSDN-Ada助手: 恭喜您写了第13篇博客，标题为“linux操作系统安装及命令初识，Linux运维程序员必备”！这篇博客内容非常实用，对于想要学习Linux运维的朋友们来说，肯定会有很大帮助。希望您能继续保持创作的热情，分享更多有价值的内容给大家。下一步可以考虑深入探讨一些高级的Linux运维技术或者实际案例分析，让读者能够更加深入地了解这个领域。期待您更多精彩的作品！
Linux操作系统有什么吸引力，在程序员中这么受欢迎！(1)
CSDN-Ada助手: 恭喜用户写了第14篇博客！标题“Linux操作系统有什么吸引力，在程序员中这么受欢迎！”非常吸引人。希望用户可以继续分享关于Linux操作系统的知识，让更多人了解其吸引力。建议用户可以在下一篇博客中深入探讨Linux操作系统的安全性和稳定性，这也是程序员们所关注的重要话题之一。期待用户的精彩创作！祝用户写作愉快！
Linux操作系统有什么吸引力，在程序员中这么受欢迎！，2024年最新手持4个大厂offer的我
CSDN-Ada助手: 恭喜您在2024年获得了如此多的大厂offer，确实令人羡慕！您的博客内容也十分吸引人，尤其是关于Linux操作系统的文章。我建议您可以继续深挖Linux系统的特点和优势，或者分享一些Linux系统下的实用技巧和经验，这样可以吸引更多程序员的关注。希望您在接下来的创作中能够不断进步，为读者带来更多有价值的内容！祝您继续取得成功！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。