Web抓取
文章平均质量分 81
xxxuehao
这个作者很懒,什么都没留下…
展开
-
CSDB Blog快速备份程序-备份你自己的Blog 基于xml(转)
以下程序需要htmlparser.jar。你可以直接从http://umn.dl.sourceforge.net/sourceforge/htmlparser/htmlparser1_5_20040728.zip下载,http://htmlparser.sourceforge.net是htmlparser的主页。//copy from here./*************************原创 2005-08-10 12:53:00 · 2028 阅读 · 1 评论 -
抓取html网页
/* * Created on 2005-8-10 * * TODO To change the template for this generated file go to * Window - Preferences - Java - Code Style - Code Templates */package org.test8;import org.htmlparser.Node;impor原创 2005-08-10 13:43:00 · 1294 阅读 · 0 评论 -
正则表达式学习笔记(转)
正则表达式学习笔记 正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。 列目录时, dir *.txt或ls *.txt中的*.txt就不是一个正则表达式,因为这里*与正则式的*的含义是不同的。 为便于理解和记忆,先从一些概念入手,所有特殊字符或字符组合有一个总表在后面,原创 2005-08-11 18:31:00 · 782 阅读 · 0 评论