python读excel内容乱码_HDFS读取excel内容出现乱码

在Python中读取HDFS上的Excel文件时遇到乱码问题。尝试了多种方法,包括使用不同的IO流和编码方式,如ByteArrayOutputStream、FSDataInputStream、InputStreamReader等,但仍然无法正确解码中文内容。期望找到解决方案。
摘要由CSDN通过智能技术生成

1.使用poi生成excel,上传hdfs

2.当有需要的时候,去下载该文件

3.下载文件是通过rest接口

4.接口中通过hdfs api读取hdfs上的excel文件内容,并转成字符串,响应到客户端

图1 通过hdfs的get命令拉去的文件,显示正常

图2 通过hdfs的java api下载的文件内容,显示乱码

最原始的代码:

public static String readFile(Configuration conf, String filePath) throws IOException,

URISyntaxException {

String fileContent = null;

FileSystem fs = getFileSystem(conf);

Path path = new Path(filePath);

InputStream inputStream = null;

ByteArrayOutputStream outputStream = null;

try {

inputStream = fs.open(path);

outputStream = new ByteArrayOutputStream(inputStream.available());

IOUtils.copyBytes(inputStream, outputStream, conf);

byte[] lens =

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值