ASP正则表达式:提取内容至组

原创 2007年09月26日 17:42:00

需采集内容如下:

1.<div class=bbb>电影地区:中国;<br>演员:刘德华;<br>日期:2003<br>:网络大本营http://www.xrss.cn</div>
2.<div class=bbb>电影地区:台湾;<br>日期:2004</div>
3.<div class=bbb>演员:张学友;<br>日期:2003/4/2</div>
......


我想将<div class=bbb>到</div>中间的内容采集成一数组里。

如何写正则表达式?

这里注明一下:我是想将中间包括地区,演员和日期,这些内容为一个值。 

 <%
Dim str
str="1.<div class=bbb>电影地区:中国;<br>演员:刘德华;<br>日期:2003<br>:网络大本营http://www.xrss.cn</div> 2.<div class=bbb>电影地区:台湾;<br>日期:2004</div>3.<div class=bbb>演员:张学友;<br>日期:20</div> "
str=replace(str,"<br>","<br>")
Dim p(100)'事先要定义数组个数
Dim i
i=0
str_soojs=""
set regEx = new RegExp
regEx.Pattern= "<div class=bbb>[^/<]+</div>"
'regEx.Pattern= "http://image.halfclub.com/Images_Product/DefaultThumbnail/[^.]+/.jpg"
regEx.IgnoreCase = True
regEx.Global = True
Set Matches=regEx.Execute(str)
For Each Matche In Matches
Matche=replace(Matche,"<br>","<br>")
p(i)=Matche'写入数组中
i=i+1
next
'测试。输出
for j=0 to ubound(p)
response.Write server.HTMLEncode(p(j))&"<p>"
next
%>

使用正则表达式提取字符串中的内容

package cn.com.songjy.test; import java.util.regex.Matcher; import java.util.regex.Pattern; public...
  • u010696927
  • u010696927
  • 2014年03月11日 20:46
  • 7188

正则表达式提取html内容

很多时候我们想从一段html中找到需要的。 比如有一段html Code Code highlighting produced by Actipro CodeHighlighter ...
  • wustzbq0713
  • wustzbq0713
  • 2015年06月07日 21:57
  • 251

Java正则表达式提取html纯文本

做内容的大家都知道,从html中直接提取纯文本是一个非常大的问题。现将我做的正则匹配贴上: import java.util.regex.Matcher; import java.util.reg...
  • w_j_w2010
  • w_j_w2010
  • 2015年11月24日 16:33
  • 1869

Linux---文本处理(正则表达式,grep,awk,sed)

文本处理(一) 本文主要讲述正则表达式,grep,awk,sed命令。 3个命令都是针对行进行处理的。 grep: 主要用来进行字符串在文件中的搜索。        示例: grep ...
  • wei_ge163
  • wei_ge163
  • 2013年06月09日 13:14
  • 6061

python提取网页的特定内容(正则表达式实现)

关于正则表达式参考正则表达式 python可以很方便地抓取网页并过滤网页的内容,那么,如何从如下的网页中提取csdn文章的标题“《unix网络编程(卷1)源代码的使用方法》”。 ...
  • u013074465
  • u013074465
  • 2015年03月16日 19:33
  • 11793

正则提取<div>中间的内容

package com.yueguang.regex; import java.io.File; import java.io.FileNotFoundException; import java....
  • u010953266
  • u010953266
  • 2015年04月06日 17:20
  • 3860

正则表达式---获取英文双引号里面的内容

有时我们会很烦恼,怎样获取英文 " " 里面的内容,因为英文的前后引号一样,会造成很多麻烦: 例如:The name "McDon ald's" is said "markudonarudo" ...
  • u010102284
  • u010102284
  • 2013年12月10日 16:36
  • 3849

java正则表达式抽取html数据

由于项目需求,需要抓取一些网站数据,于是这两天研究了下java正则表达式和java模拟http请求。 一直以来,看到正则表达式就头疼,认为很难看懂,需要就从网上搜,但是这次需要抽取的是html数据,...
  • w_j_w2010
  • w_j_w2010
  • 2015年11月24日 09:43
  • 1002

【python学习笔记】用正则表达式从含中文的网页中提取数据(含编码转换)

目标:用正则表达式从含中文的网页中提取数据 1、获得网页全部数据 1.1思考过程 确定我们要操作的网页:url = 'http://q.stock.sohu.com/cn/603077/cwzb.sh...
  • pzxzhy
  • pzxzhy
  • 2015年12月27日 17:05
  • 2467

java 正则表达式获取指定两个字符串之间内容

xml解析利用正则表达式获取指定两个字符串之间内容                       在遇到解析复杂xml的时候,想到大家所想到的都是利用dom4j作为首发工具,但是当遇到层次很多...
  • u013144287
  • u013144287
  • 2017年06月02日 16:05
  • 14671
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:ASP正则表达式:提取内容至组
举报原因:
原因补充:

(最多只允许输入30个字)