我有一个文件,其中包含如下字符:“Joh 1:1ஆதியிலேஆதியிலே்த்தைதை்தது,அந்ததவாரதததைதைதைதைதைதைதைதேவனிடதததுததுததுததுததுததுததுததுததுததுததுததுததுததுததுததுததுததுததுததுததுததுதது”“”“”“”“”“
当我使用以下代码时:
bufferedWriter = new BufferedWriter (new OutputStreamWriter(System.out, "UTF8"));
输出是框和其他奇怪的字符,如下所示:
“P = O֛;
有人可以帮忙吗?
这些是完整的代码:
File f=new File("E:\\bible.docx");
Reader decoded=new InputStreamReader(new FileInputStream(f), StandardCharsets.UTF_8);
bufferedWriter = new BufferedWriter (new OutputStreamWriter(System.out, StandardCharsets.UTF_8));
char[] buffer = new char[1024];
int n;
StringBuilder build=new StringBuilder();
while(true){
n=decoded.read(buffer);
if(n<0){break;}
build.append(buffer,0,n);
bufferedWriter.write(buffer);
}
StringBuilder值显示UTF字符,但在窗口中显示时,它显示为框.
找到问题的答案!!!
编码是正确的(即UTF-8)Java将文件读取为UTF-8,字符串字符为UTF-8,问题是在netbeans的输出面板中没有字体显示它.更改输出面板的字体(Netbeans-> tools-> options-> misc->输出选项卡)后,我得到了预期的结果.当它在JTextArea中显示时(需要更改字体),同样适用.但我们无法更改windows’cmd提示字体.