Kafka为了保证传输效率,消息传输使用二进制传输,而支持中文的使用最广泛的编码方式为UTF-8。因此解决这个问题的思路如下:在productor中使用UTF-8的方式编码,在consumer中使用UTF-8解码。
示例如下:
1 productor:
在代码最前端加入编码声明
# -*- coding: utf-8 -*-
PS:在这里要对kafka的异步机制提出一点异议:在同一个大网内的服务器和客户端,存在客户端发送消息的时候,服务器还没有接受到消息,客户端的线程已经被销毁,导致单条消息没法传输。因此必须要设置一定的线程等待时间,如果有更好的解决办法请联系我。
2 consumer:
for msg in consumer:
recv = "%s:%d:%d: key=%s value=%s" % (msg.topic, msg.partition, msg.offset, msg.key, msg.value.decode('utf-8'))
log(recv)
多了一步使用UTF-8解码的操作。
效果如下: