正则表达式
文章平均质量分 70
iteye_8381
这个作者很懒,什么都没留下…
展开
-
常用正则表达式大全
常用正则表达式大全!(例如:匹配中文、匹配html) 匹配中文字符的正则表达式: [\u4e00-\u9fa5] 评注:匹配中文还真是个头疼的事,有了这个表达式就好办了 匹配双字节字符(包括汉字在内):[^x00-xff] 评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 匹配空白行的正则表达式:ns*r 评注...原创 2010-01-14 15:10:32 · 77 阅读 · 0 评论 -
6个在线正则表达式工具
正则表达式可以让开放人员更加有效的操纵文本内容,在各种各样的开发中经常会遇到需要正则表达式解决的问题,比如验证邮箱,验证网址,一些小偷程序的批量替换等等。熟练的应用正则表达式可以方便于很多文本的操作,加快开发的进度。 但是正则表达式并不是一个非常简单的东西,很多时候在应用的过程中会出现一些逻辑或者非逻辑上的错误和疏漏,那么我们正式需要一些工具来辅助我们验证正则表达式的正确性。...原创 2010-01-15 09:27:06 · 2333 阅读 · 0 评论 -
正则表达式学习 ---- 抓取远程网页并解析HTML
import java.util.regex.Matcher; import java.util.regex.Pattern; import org.apache.commons.httpclient.HttpClient; import org.apache.commons.httpclient.HttpStatus; import org.apache.comm...原创 2010-08-04 22:01:04 · 165 阅读 · 0 评论 -
java 正则表达式 抓取网页中的新闻
package rssTest; import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURLConnection; import java.net.MalformedURLExcepti...原创 2010-08-04 22:02:26 · 295 阅读 · 0 评论 -
深度抓取
下面是我在网上找到的一个例子,运行之后它会把域名下的所有网页抓取回来,而我只想要域名下部分网页中的url,比如我给的地址是book.easou.com,它会把easou.com下所有网页中的URL给抓回来,但我只想要book.easou.com下的网页中的URL,那个正则表达式,我改了很久还是达不到我想要的效果,谁能帮我看看?谢谢!package com.easou.crawler;import ...原创 2010-08-04 22:10:32 · 190 阅读 · 0 评论