Java8读取文件的四种方法及指定编码格式实例

最新推荐文章于 2024-04-14 15:08:19 发布

陆沙

最新推荐文章于 2024-04-14 15:08:19 发布

阅读量6.3k

点赞数 1

分类专栏：工作技巧文章标签： java 字符串

本文链接：https://blog.csdn.net/pxy7896/article/details/107203560

版权

工作技巧专栏收录该内容

55 篇文章 1 订阅

订阅专栏

最常用

FileInputStream

FileInputStream fis = new FileInputStream(filePath); // filePath是自定义路径str
// 指定编码格式
BufferedReader br = new BufferedReader(new InputStreamReader(fis, "utf-8"));
String line = null;
while ((line = br.readLine()) != null) {
    //System.out.println(line);
    //break;
}
fis.close();

下面两种方法需要用Charset对象指定编码方法。Charset文档在这里搜索可得。

Stream

Charset c = Charset.forName("UTF-8");
//System.out.println(Charset.isSupported("UTF-8"));
try(Stream<String> stream = Files.lines(Paths.get(filePath), c)) {
    List<String> raws = new ArrayList<>();
    raws = stream.collect(Collectors.toList());
    for (String s:raws) {
        //System.out.println(s);
    }
} catch(IOException e) {
    e.printStackTrace();
}

实际上，对于stream，还可以在中间做一些处理：

//1. filter line 3
//2. convert all content to upper case
//3. convert it into a List
list = stream
   .filter(line -> !line.startsWith("line3"))
   .map(String::toUpperCase)
   .collect(Collectors.toList());

传统方法

BufferedReader

Charset c = Charset.forName("UTF-8");
// 不能用字符串，要用Charset对象来指定编码方式
try(BufferedReader br = Files.newBufferedReader(Paths.get(filePath), c)) {
    List<String> list = br.lines().collect(Collectors.toList());
    for (String s : list) {
        //System.out.println(s);
    }
} catch (IOException e) {
    e.printStackTrace();
}

Scanner

Scanner比BufferedReader更慢，因为Scanner对输入数据进行正则解析，而BufferedReader只是简单地读取字符序列。且BufferedReader的缓冲区大小为8KB，Scanner的缓冲区大小为1KB。

try(Scanner scanner = new Scanner(new File(filePath), "UTF-8")) {
    while(scanner.hasNext()) {
        //System.out.println(scanner.nextLine().toString());
    }
} catch(IOException e) {
    e.printStackTrace();
}