java用正则提取网页,怎样用正则表达式提取网页文本,该怎么处理

怎样用正则表达式提取网页文本,该怎么处理

怎样用正则表达式提取网页文本,该怎么处理

日期:2014-05-16  浏览次数:20150 次

怎样用正则表达式提取网页文本

比如其中一段如下:

//--------------------------------

办理护照延期须提供如下材料:

1、提供本人所持中国护照原件及其资料页的复印件;  

2、交二寸证件照片一张;  

3、填写“中 华人 民共和国护照/旅行证/海员证/回国证明申请表”一份;  

4、交验获准在加拿大居留、工作或学习的证件(如:PERMANENT   RESIDENT   CARD、WORK   PERMIT、STUDY   PERMIT)原件并提供其复印件;

5、获加拿大永久居民身份满3年且尚未领取枫叶卡者,还须提供未入加拿大国籍的证明。此证明可向下列地址申请:  
CITIZENSHIP   AND   IMMIGRATION   CANADA  
CASE   PROCESSING   CENTER   SYDNEY  
P.   O.   BOX   7000   SYDNEY,   NOVA   SCOTIA   B1P   6V6  

//-------------------

如何提取出里面的纯文本内容,不含标签。

------解决方案--------------------

//--------------------------------

办理护照延期须提供如下材料:

1、提供本人所持中国护照原件及其资料页的复印件;

2、交二寸证件照片一张;

3、填写“中 华人 民共和国护照/旅行证/海员证/回国证明申请表”一份;

4、交验获准在加拿大居留、工作或学习的证件(如:PERMANENT RESIDENT CARD、WORK PERMIT、STUDY PERMIT)原件并提供其复印件;

5、获加拿大永久居民身份满3年且尚未领取枫叶卡者,还须提供未入加拿大国籍的证明。此证明可向下列地址申请:
CITIZENSHIP AND IMMIGRATION CANADA
CASE PROCESSING CENTER SYDNEY
P. O. BOX 7000 SYDNEY, NOVA SCOTIA B1P 6V6

//-------------------

var str=textarea1.value;

str=str.replace(/ ]*?> /ig, " ");

alert(str);

------解决方案--------------------

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

※以下是引用楼主 younkersoft(younkersoft) 在2007-05-07 16:06:18 的发言:

──────────────────────────────────────────

就是想求出取

"

"

"

"

之间内容的一个正则表达式

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

测试用的干扰字符

免责声明: 本文仅代表作者个人观点,与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值