Java通过正则去掉文章里的多个连续空行

// 去掉多个换行
ontent = content.replaceAll("(\r?\n(\\s*\r?\n)+)", "\r\n");


[b]从word中读取内容,通过正则去掉文章里的多个连续空行[/b]
package cn.com.quiz;

/*
读取word内容并把内容写入到一个String中

去掉那些
换行+(任意个空白+换行) 替换为一个换行

换行可能是\n 也可能是 \r\n 所以使用 \r?

*/

import java.io.*;

import org.textmining.text.extraction.WordExtractor;

class FileToString
{
public static void main(String[] args) throws IOException
{


FileInputStream in = new FileInputStream(".\\123.doc");
WordExtractor extractor = new WordExtractor();

try
{
String out = extractor.extractText(in);
System.out.println("before: " + out);
out = out.replaceAll("(\r?\n(\\s*\r?\n)+)", "\r\n");
System.out.println("after: " + out);
}
catch (Exception e)
{
e.printStackTrace();
}

}
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值