使用java写入csv文件,并且文件编码也设成了“UTF-8”:
File file = new File("a.csv");
OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream(file),"UTF-8");
BufferedWriter bw = new BufferedWriter(osw);
bw.write("这是中文");
bw.flush();
bw.close();
osw.close();
生成csv文件后,打开的默认方式是excel,但是用excel打开后发现里面的中文全都是乱码。(需要注意的是,如果用txt文本文档打开,就不是乱码,显示正常。)
网上找了一个解决办法,让把文件编码换成gbk就行了。
OutputStreamWriter out = new OutputStreamWriter(new FileOutputStream(file), "gbk");
但是这样治标不治本,我就需要UTF-8呢,而且正常情况下也应该用UTF-8呀。
于是我找到了一个最好的解决办法。可以通过在csv的文件头设置BOM(Byte order mark)来解决。
BufferedWriter out = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(file), "UTF-8"));
out.write('\ufeff');
out.write("需要写入的文件内容");
上面代码的核心就是 out.write('\ufeff');
,通过写入BOM \ufeff
来解决。
关于BOM的详细解释,可以看相应的维基百科:https://en.wikipedia.org/wiki/Byte_order_mark#UTF-8