antdz网站内容批量提取器



 


嗯,这个程序基本完成了。今天测试了一下,虽没有想象中好,但是还能用。在未来的日子里会细化的。
用这个程序把从新浪上下载的网页给合成了,呵呵,不错,不错~~~

 

-------------------------------------------------------------------------------------------------------------

antdz采集器说明
作者: antdz (菜鸟一只)
email: vip_antdz@163.com
几个月前,从新浪读书中发现了一本好书,就用迅雷下载了全部链接,打算编辑到一个文件中。结果发现下载的网页太多了,假如使用复制粘贴过于繁琐,就想做个小程序,批量完成这个工作。其中写这个程序用的时间不长,因为工作等原因,间隔时间很长。还好,今天做完了大概功能。在以后的日子里再进行慢慢细化吧。
2011-6-19


ver 0.1001

运行spider.exe

使用add 批量添加文本文档(txt html htm),在正则表达式里填写要提取的内容的正则表达式,再点let's go按钮。中间会卡一下,在以后的版本中会细化。
在没有添加文本文档前不要按 let's go 及testRegExp按钮,会出现错误的。在以后的版本中会细化。

提取的内容会存放在和程序一个目录下的tmp.txt文件中。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值