- 博客(1)
- 资源 (4)
- 收藏
- 关注
原创 Spark 处理中文乱码问题(UTF-8编码)
问题场景 要用spark处理一大堆微信日志数据,日志存放在HDFS上,是xml格式,里面有大量的中文。用scala + java实现了xml的处理逻辑,其中有一步是要获取xml中的一个title字段,中文。不管怎么抓取,最终得到的中文都会变成一堆“?????”,乱码了。从xml中获取非中文字段,没有任何问题。也就是说,代码的逻辑是没什么问题的。
2015-12-03 16:14:24 39086 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人