UTF_16LE导致读取字幕文件首行失败

读取字幕文件时,没有直接用字符串分割,而是尝试使用正则来匹配,分割

字幕文件

Pattern pattern = Pattern.compile("Dialogue: \\d+,(\\d+:\\d+:\\d+\\.\\d+),(\\d+:\\d+:\\d+\\.\\d+),[^,]*,[^,]*,[^,]*,[^,]*,[^,]*,[^,]*,(.*?)");
        try (BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(filePath),StandardCharsets.UTF_16LE))) {
         
            String line;
            while ((line = reader.readLine()) != null){
                lines.add(line);
               // System.out.println(line);
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
  for (int i = 0; i < lines.size()/2; i++) {
            Matcher matcher = pattern.matcher(lines.get(i));
            System.out.println(lines.get(i));
            if (matcher.matches()) {
                System.out.println(i);
                String startTime = matcher.group(1);
                String endTime = matcher.group(2);
                String text = matcher.group(3).replaceAll("\\{[^}]+\\}", "").trim();
                    startTimes.add(startTime);
                    endTimes.add(endTime);
                    subtitles1.add(text);
                //System.out.println(text);
            }
        }

然后每次都读不到第一行,后来百度,问ai,发现时utf_16首行前面有隐藏的东西BOM,加了以下代码解决

        try (BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(filePath),StandardCharsets.UTF_16LE))) {
            reader.mark(1);
            if (reader.read() != 0xFEFF) { // 检查是否有BOM,0xFEFF是UTF-16的BOM
                reader.reset(); // 如果没有BOM,重置reader到开头
            }
            String line;
            while ((line = reader.readLine()) != null){
                lines.add(line);
               // System.out.println(line);
            }
        } catch (Exception e) {
            e.printStackTrace();
        }

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值