Java读取TXT文件中文输出乱码

问题背景

利用Scanner读取TXT文件中的英文单词和中文对应的键值对,输出时中文乱码,英文不会

分析

首先发现,代码其他地方没有问题,文件读取和输出行为没有问题,出现乱码的原因很可能是读取编码和输出编码显示编码不匹配造成的;
就和之前在cmd输出报错中文字符乱码一样,如果将cmd编码设置为utf-8,但是报错信息编码为GBK,那么输出的报错中文字符就会显示为乱码;
因此,从读取的TXT文件,输入输出流的读取编码做对比找原因。

解决问题

将TXT文件保存为ANSI编码格式;
将文件读取格式设置为ANSI,转换为UTF-8,输出格式为utf-8;
如此,中文不在乱码,解决问题。

存在不足

在将TXT文件修改成gbk、utf-8格式时,文件读取仍然是乱码,这个问题没有完全解决;

File file = new File("word.txt");
Scanner sc = null;
WordPolice(){
    hashtable = new HashMap<String,String>();
    try{
        sc = new Scanner(file);
        while(sc.hasNext()){
            String englishWord = new String(sc.next().getBytes("ANSI"),"utf-8");
            String chineseWord = new String(sc.next().getBytes("ANSI"),"utf-8");
            hashtable.put(englishWord,chineseWord);
        }
    }
    catch(Exception e){}
}
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值