情况描述:
当CSV文件下载后使用UTF-8,但是Excel文件打开为乱码,本地编辑器打开,另存为UTF-8之后,在用Excel文件打开就不再是乱码,通过查看后发现,此时的编码方式为
UTF-8 BOM 格式;
原因:
当从http 的response输出CSV文件的时候,设置为utf8的时候默认是不带bom的,但是windows的Excel是使用bom来确认utf8编码的,所有需要把bom写到文件的开头。
微软在 UTF-8 中使用 BOM 是因为这样可以把 UTF-8 和 ASCII 等编码明确区分开。
否则用Excel打开CSV文件有可能是乱码的。
解决方案:
若是文件是服务器生成的需要在生成文件处设置:
File csvFile = null;
BufferedWriter csvFileOutputStream = null;
CSVPrinter csvPrinter = null;
CSVFormat csvFileFormat = CSVFormat.DEFAULT.withHeader(headers);
try {
csvFile = new File(csvFilePath);
OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream(csvFile),"UTF-8");
osw.write(new String(new byte[] { (byte) 0xEF, (byte) 0xBB,(byte) 0xBF }));
csvFileOutputStream = new BufferedWriter(osw,1024);
}
或者在reponse的getOutputStream处设置
OutputStream out = response.getOutputStream();
out.write(new byte[]{(byte)0xef,(byte)0xbb,(byte)0xbf});