package com.gao;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStreamReader;
import java.nio.charset.Charset;
import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class TestMain {
private static final int MIN_THRESHOLD = 50;
private static final int MAX_THRESHOLD = 80;
private static List<String> list = new ArrayList<String>();
/**
* @param args
*/
public static void main(String[] args) {
String str = null;
try {
InputStreamReader isr = new InputStreamReader(new FileInputStream(new File
java 将英文文章 按句子,标点符号分割,正则表达式
最新推荐文章于 2024-07-08 03:18:07 发布
这是一个Java程序,用于将英文文章按句子和特定标点符号分割。程序读取文件,使用正则表达式 `[。?!?.!]` 匹配句子结束符,并将分割后的句子存储到List中。它还处理了句子长度小于50个字符的情况,确保分割粒度满足要求。
摘要由CSDN通过智能技术生成