java读取csv文件或者java读取字符串,找出引号内容,采用正则表达式书写

  1. 将一个csv文件复制出来将后缀改变为txt,我们就得到了一个文件文件
  2. 打开这个txt文件,可以看到每一个字段之间都是用英文逗号隔开

正常的内容形似

20,C4,Pm,tem,tion,21,A4,E,H,"1,2,3,NA,aaa,bbbb,cccc,ddd,N/A,aaa,bbbb,cccc,ddd,tttttt

对于这种我们只需要进行简单的逗号分割就可以拿到每个字段的值

String input = "20,C4,Pm,tem,tion,21,A4,E,H,\"1,2,3,NA,aaa,bbbb,cccc,ddd,N/A,aaa,bbbb,cccc,ddd,tttttt";
String[] fields = input.split(",");
for (String field : fields) {
    System.out.println(field);
}

带引号的文本

当我们打开文件如果看到,文本中有的字段是双引号括起来的,里面也同样用逗号隔开,上面的方法便不再适用了,文本内容如下

20,C4,Pm,tem,tion,21,A4,E,H,"1,2,3",NA,"aaa,bbbb,cccc,ddd",N/A,"aaa,bbbb,cccc,ddd",tttttt

这里我们可以看到 "1,2,3" "aaa,bbbb,cccc,ddd" "aaa,bbbb,cccc,ddd" 这三组都是被引号括起来的
此时采用

public class CSVReader {
    public static void main(String[] args) {
        String csvFile = "path/to/your/csv/file.csv";
        String line = "";
        String csvSplitBy = ",(?=([^\"]*\"[^\"]*\")*[^\"]*$)";

        try (BufferedReader br = new BufferedReader(new FileReader(csvFile))) {
            while ((line = br.readLine()) != null) {
                String[] data = line.split(csvSplitBy);
                for (String datum : data) {
                    System.out.print(datum + " ");
                }
                System.out.println();
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

解释如下:
这个正则表达式可以分为两部分:

  1. 逗号分隔符:,
  2. 前瞻语法:(?=([^\"]*\"[^\"]*\")*[^\"]*$)

前瞻语法是一种零宽度断言,它用于匹配一个位置,这个位置后面的文本符合某种模式。这个正则表达式中的前瞻语法表示:

  1. (?=...):表示正向前瞻,即匹配后面的文本必须符合括号中的模式。
  2. ([^\"]*\"[^\"]*\")*:表示匹配任意数量的双引号内的文本,其中:
  • [^\"]*:表示匹配任意数量的非双引号字符。
  • \"[^\"]*\":表示匹配一对双引号内的任意数量的非双引号字符。
  • (...)*:表示匹配任意数量的前面的模式。
  1. [^\"]*$:表示匹配任意数量的非双引号字符,直到字符串末尾。

综合起来,这个正则表达式的意思是:匹配逗号,并且这个逗号后面的文本必须符合以下模式:在这个逗号后面,如果有偶数个双引号,则这个逗号是字段分隔符;如果有奇数个双引号,则这个逗号是双引号内的文本,不是字段分隔符。这个正则表达式的作用是避免将双引号内的逗号误认为是字段分隔符。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Java可以使用以下几种方式来处理csv文件: 1. 使用第三方库,比如OpenCSV、Apache Commons CSV和Super CSV。 2. 使用Java的Scanner类来读取文件,再使用String.split()方法将数据分割成单独的字段。 3. 使用Java 8的新特性——Stream API和Lambda表达式,可以使用Files.lines()方法读取文件的每一行,再使用map()方法将每一行映射成一个字符串数组。 例如,下面是使用第三种方式读取csv文件的示例代码: ``` List<String[]> records = new ArrayList<>(); try (Stream<String> stream = Files.lines(Paths.get("file.csv"))) { stream.forEach(line -> records.add(line.split(","))); } catch (IOException e) { e.printStackTrace(); } ``` 此外,还可以使用Java的FileReader和BufferedReader类来读取文件,再使用String.split()方法将数据分割成单独的字段。 例如,下面是使用这种方式读取csv文件的示例代码: ``` List<String[]> records = new ArrayList<>(); try (BufferedReader br = new BufferedReader(new FileReader("file.csv"))) { String line; while ((line = br.readLine()) != null) { records.add(line.split(",")); } } catch (IOException e) { e.printStackTrace(); } ``` 希望这些信息能帮到你! ### 回答2: Java可以通过使用各种库和API来处理CSV文件。以下是一些常见的方法: 1. 使用Java的内置库:Java提供了自带的CSV解析器类库,如`java.nio`包中的`Scanner`类和`BufferedReader`类,可以用于读取和解析CSV文件内容。这些类提供了一些方法来逐行读取和解析CSV文件中的数据,并将其存储在Java对象中。 2. 使用第三方库:除了Java自带的库之外,还有一些流行的第三方库可以用来处理CSV文件,如Apache Commons CSV库和OpenCSV库。这些库提供了更高级的功能,如将CSV数据映射到Java对象模型、写入CSV文件等。 3. 使用字符串分割方法:如果CSV文件的结构比较简单,可以使用Java字符串分割方法来处理CSV文件。可以使用`String.split()`方法将每行的数据分割成不同的字段,并将其存储在数组或其他数据结构中。 4. 使用正则表达式:使用Java正则表达式可以处理CSV文件。可以编写正则表达式来匹配CSV文件的每个字段,然后使用Java正则表达式API来提取匹配的内容。 不管使用哪种方法,都应该注意处理CSV文件中可能存在的特殊字符(如逗号或双引号)以及处理文件的编码问题。正确地处理CSV文件可以确保数据的完整性和准确性。 ### 回答3: Java可以使用第三方库如OpenCSV或Apache Commons CSV处理CSV文件。 使用OpenCSV处理CSV文件的基本步骤如下: 1. 导入OpenCSV库。可以通过在项目的构建文件中添加OpenCSV依赖项,或手动下载库文件并导入到项目中来完成。 2. 创建CSVReader对象。CSVReader是OpenCSV库提供的一个类,它负责读取CSV文件内容。需要传入一个文件输入流或文件对象作为参数。 3. 使用CSVReader对象读取CSV文件内容。可以使用while循环和readNext()方法来逐行读取文件内容。 4. 处理读取到的每一行数据。OpenCSV将每一行数据读取为一个字符串数组,数组的每个元素是CSV文件中的对应字段。可以根据需要对每一行数据进行处理,比如提取特定字段的值、进行数据类型转换等。 使用Apache Commons CSV处理CSV文件的基本步骤如下: 1. 导入Apache Commons CSV库。可以通过在项目的构建文件中添加Apache Commons CSV依赖项,或手动下载库文件并导入到项目中来完成。 2. 创建CSVParser对象。CSVParser是Apache Commons CSV库提供的一个类,它负责解析CSV文件内容。需要传入一个文件输入流或文件对象作为参数。 3. 使用CSVParser对象解析CSV文件内容。可以使用foreach循环和getRecords()方法来获取CSV文件中的每一行数据。 4. 处理解析到的每一行数据。Apache Commons CSV将每一行数据解析为一个CSVRecord对象,该对象可以通过get()方法获取对应字段的值。可以根据需要对每一行数据进行处理,比如提取特定字段的值、进行数据类型转换等。 无论是使用OpenCSV还是Apache Commons CSV处理CSV文件,都需要注意文件编码和字段分隔符的设置,以确保正确解析文件内容。此外,还应该注意处理可能出现的异常情况,比如文件不存在、文件格式错误等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值