问题:如何在分割后保留分隔符?
对中文字符串,用标点符号(如!?:;等)作为分隔符,使用string.split()方法,具体代码如下:
/**********************************************************
* 给段落分句:以句号。、感叹号!、问号?、冒号:、分号;为句子标识符
* @param String paragraph
* @return String[] result
***********************************************************/
public String[] SplitSentence(String paragraph) {
String[] result = null;
result = paragraph.split("。|!|?|:|;");
return result;
}
例如:paragraph="经济实力大幅提升。经济保持平稳快速发展,物价基本稳定。社会主义新农村建设扎实推进,区域发展协调性增强。创新型国家建设进展良好,自主创新能力较大提高。"
希望得到分割后的结果为:
result[0]="经济实力大幅提升。";
result[1]="经济保持平稳快速发展,物价基本稳定。";
result[2]="社会主义新农村建设扎实推进,区域发展协调性增强。";
result[3]="创新型国家建设进展良好,自主创新能力较大提高。";
解答:lhx222 (初级程序员)
/*需要分割的文章*/
String str = "第一句。第二句!第三句:第四句;第五句。";
/*正则表达式:句子结束符*/
String regEx=":|。|!|;";
Pattern p =Pattern.compile(regEx);
Matcher m = p.matcher(str);
/*按照句子结束符分割句子*/
String[] words = p.split(str);
/*将句子结束符连接到相应的句子后*/
if(words.length > 0)
{
int count = 0;
while(count < words.length)
{
if(m.find())
{
words[count] += m.group();
}
count++;
}
}
/*输出结果*/
for(int index = 0; index < words.length; index++)
{
String word = words[index];
System.out.println("word = " + word);
}