正则表达式提取html内容

 很多时候 我们 想从一段 html 中找到需要的。
比如有一段html
Code
<!--

Code highlighting produced by Actipro CodeHighlighter (freeware)
http://www.CodeHighlighter.com/

-->some do<div class ="postTitle"><id="homepage1_HomePageDays_DaysList_ctl01_DayItem_DayList_ctl02_TitleUrl" class="postTitle2" href="http://www.cnblogs.com/netfuns/archive/2009/09/28/1575829.html">把一个sql where表达式转化为一个二叉树</a>ddd<div><div >2</div></div></div><br />如题。比如我们有一个sql<br />select a.id from b ,c<br />where<br />&nbsp;(b.id=c.id) and ((b.code='a' and c.code='d') or b.name='c' )<br /><br />将 where 后面的表达式转化为二叉树.<br /><br /><br />:( 俺也不会<br />有空研究研究<div class = "postDesc">posted @ <href="http://www.cnblogs.com/netfuns/archive/2009/09/28/1575829.html" Title = "permalink">2009-09-28 17:02</a> netfuns 阅读(45) | <href="http://www.cnblogs.com/netfuns/archive/2009/09/28/1575829.html#FeedBack" Title = "comments, pingbacks, trackbacks">评论 (0)</a> |&nbsp;<href="http://www.cnblogs.com/netfuns/admin/EditPosts.aspx?postid=1575829">编辑</a>
<div id=level1>level1
<div id=level2>level2
<div>level3</div>
<div/>
</div>
</div> some end

正则1:<div class ="postTitle">(?<name>[\s\S]+?)</div>
结果为
<div class ="postTitle">dddd<a id="homepage1_HomePageDays_DaysList_ctl01_DayItem_DayList_ctl02_TitleUrl" class="postTitle2" href="<A" target="_blank" rel="nofollow">http://www.cnblogs.com/netfuns/archive/2009/09/28/1575829.html">把一个sql where表达式转化为一个二叉树</a>ddd<div>1 <div >2</div>
说明不能嵌套。但对于简单的标记是 可以 了。

正则2 :
<div class ="postTitle">(?<mycontent>[\s\S]+)</div>
结果:
得到整个div,包括嵌套的 内容 .
说明对于嵌套的html标记内容提取是可以的
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值