log4j2+kafka+ELK输出日志乱码解决过程

最新推荐文章于 2024-08-09 11:24:06 发布

彼此的明天

最新推荐文章于 2024-08-09 11:24:06 发布

阅读量4.5k

点赞数 1

分类专栏： JAVA基础文章标签：乱码 ELK

本文链接：https://blog.csdn.net/q1564/article/details/82986983

版权

JAVA基础专栏收录该内容

1 篇文章 0 订阅

订阅专栏

log4j2+kafka+ELK输出日志乱码解决过程

平台搭建完毕后测试发现在kibana中输出的中文全都成了乱码，百度上搜索了一番，都说用logstash的codec组件进行转码，有些说input和output上都配置，有些说只需配置在input上，捣鼓了半天试了七八种与编码的组合，依然是乱码，只是乱码的种类不一样…

于是我想，会不会存入kafka的时候就成了乱码，在命令行消费消息控制台打出显示却是正常的…WTF

后面看到这位仁兄的博客 https://blog.csdn.net/evilcry2012/article/details/78092559 里面提到了
GBK转UTF-8后生成：��й��
GBK转换成UTF-8再转成GBK：锟斤拷锟斤拷锟斤拷锟叫癸拷锟斤拷
且GBK转成UTF-8是不可逆的操作，就算再转成GBK也无法回到最初的状态

于是我去掉了所有的编码配置，还原到最初状态，重启后发现中文对应的乱码是��й��此种格式，
此时我恍然大悟，windows默认的字符编码是GBK，所以日志传入kafka之前应该是GBK的，但是不知道后面哪个环节被转成了UTF-8，且操作是不可逆的。要查出到底是哪个环节被转成了UTF-8，估计要不少的时间，时间紧迫于是选择了一种较为快捷的办法，在log4j2输出的时候就指定以UTF-8输出

<Kafka name="Kafka" topic="${KAFKA_TOPIC}">
    <PatternLayout charset="UTF-8" pattern="%date{yyyy-MM-dd HH:mm:ss,SSS} [${SERVER_NAME}] [%thread] %level [%C{36}.%M] - %msg%n"/>
    <Property name="bootstrap.servers">${KAFKA_SERVERS}</Property>
</Kafka>