java bufferreader乱码,javaBufferdReader读取文件乱码以下为读取文件方法123456789101112131415161718192021222324252627pri...

本文探讨了在Java中使用BufferedReader读取文件时遇到的乱码问题,重点在于识别BOM编码标记,如何通过UTF-8无BOM格式转换来解决Windows环境下文件的第一行乱码问题。通过实例代码和BOM编码概念解析,提供了解决编码问题的方法。
摘要由CSDN通过智能技术生成

javaBufferdReader读取文件乱码

以下为读取文件方法1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27private static void putIdGame(){

URL.setURLStreamHandlerFactory(new FsUrlStreamHandlerFactory());

int count = 0;

try {

URL url = new URL(HDFS + path);

InputStream gameList = url.openStream();

BufferedReader reader_url = new BufferedReader(new InputStreamReader(gameList,"UTF-8"));

String inString_RL = reader_url.readLine();

while (inString_RL != null && count < 50) {

int userId;

String[] str = inString_RL.split(",");

count ++;

map.put(str[1], str[0]);

System.out.println(str[0]);

inString_RL = reader_url.readLine();

}

reader_url.close();

} catch (FileNotFoundException e) {

System.out.println("未找文件!");

} catch (IOException e1) {

System.out.println("文件读写错误!");

}

}

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26static

URL.setURLStreamHandlerFactory(new FsUrlStreamHandlerFactory());

int count = 0;

try {

URL url = new URL(HDFS + path);

InputStream gameList = url.openStream();

BufferedReader reader_url = new BufferedReader(new InputStreamReader(gameList,"UTF-8"));newBufferedReadernew

String inString_RL = reader_url.readLine();

while (inString_RL != null && count < 50) {null

int userId;

String[] str = inString_RL.split(",");strsplit

count ++;

map.put(str[1], str[0]);str1str

System.out.println(str[0]);str

inString_RL = reader_url.readLine();

}

reader_url.close();

} catch (FileNotFoundException e) {

System.out.println("未找文件!");

} catch (IOException e1) {

System.out.println("文件读写错误!");

}

在InputStreamReader中加入”UTF-8”即可

Java读取文件时第一行出现乱码“?”问号

在windows 环境下,使用java文件流读取文本文件时,会出现第一个字符为未知字符”?” ,其他字符完整。而且第一个字符显示为?但是用equals比对发现并非是”?”号,google之,了解到bom编码标记。使用 16进制打印输出结果:

只要出现该头的16进制编码为这种字符便可以断定该文本文件的编码方式了。

bom编码标记:

bom全称是:byte order mark,汉语意思是标记字节顺序码。只是出现在:unicode字符集中,只有unicode字符集,存储时候,要求指定编码,如果不指定,windows还会用默认的:ANSI读取。常见的bom头是:

UTF-8 ║ EF BB BF

UTF-16LE ║ FF FE (小尾)

UTF-16BE ║ FE FF (大尾)

UTF-32LE ║ FF FE 00 00

UTF-32BE ║ 00 00 FE FF

解决方法:工具将txt文件另存为UTF-8无BOM格式

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17String

StringBuffer strBuff = new StringBuffer();

String temp = null;

BufferedReader reader = new BufferedReader(new InputStreamReader(in,Charset.forName("utf-8")));BufferedReadernewInputStreamReaderin

while ((temp = reader.readLine()) != null) {

byte[] by = temp.getBytes();

String header = Integer.toHexString(by[0]).toUpperCase();

if (header.equalsIgnoreCase("FFFFFFEF") || header.equalsIgnoreCase("3F")) {"FFFFFFEF"

strBuff.append(temp.substring(1) + "n");

continue;

}

strBuff.append(temp + "n");

}

reader.close();

in.close();

return strBuff.toString();

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值