数据采集
文章平均质量分 80
redsee
这个作者很懒,什么都没留下…
展开
-
用.net实现远程获取其他网站页面内容!(核心代码分析)
远程获取网页内容.经过一定的处理和灵活应用,可以开发成成体系网站内容采集系统.通常也叫做"新闻小偷"一般来说.做内容采集分为如下几个大致的步骤:1.远程获取页面的全部Html源文本.2.通过过滤处理,分析有效内容文本.(通常用正则表达式来截取有效数据)3.将格式有效的数据,根据自己的数据库结构分标题,内容....一些其他属性保存到自己的本地数据库.ok整个采集过程如此简单.原理也不难.下面我们看看原创 2006-08-29 11:22:00 · 874 阅读 · 0 评论 -
ASP:小偷例子之保存远程图片
Function ReplaceRemoteUrl(sHTML, sSaveFilePath, sFileExt)////远程保存图片/////////////////////////////////////////////////////作 用:替换字符串中的远程文件为本地文件并保存远程文件参 数: sHTML : 要替换的字符串 sSavePath原创 2006-08-29 11:30:00 · 935 阅读 · 0 评论 -
远程抓取模拟Cookie
我想实现的是:通过登录页面http://china.alibaba.com/member/signin.htm登录后抓取下面这个页面http://china.alibaba.com/member/myalibaba.htm?ca=true可是不行啊。。。。但是我同样的程序抓其他站点的页面是可以的。为什么这个不行啊。。。。我的代码如下:string url = "http://chin原创 2006-08-29 11:25:00 · 1699 阅读 · 0 评论 -
Asp小偷程序写入数据库
Untitled Documenton error resume next Server.S criptTimeout = 999999==================================字符编码函数=================================Function BytesToBstr(body,code) dim obj转载 2006-08-29 11:31:00 · 1695 阅读 · 0 评论 -
小偷程序(ASP.NET+c#)
小偷程序(ASP.NET+c#)在.Net 平台下,创建一个ASP.Net的程序 1、引用两个NAMESPACE using System.Text //因为用了Encoding类 using System.Net //因为用了WebClient 类 2、整个程序用了三个控件 txtUrl //输入你要获取的网页地址 TEXTBOX转载 2006-08-29 11:33:00 · 1456 阅读 · 0 评论 -
三款小偷程序(ASP.NET)
1、MP3资源都在互联网上,有时听不了也是正常,但大多数不好用,真是用处不大了。仔细分析了一下它的源码,原来是读取目录下的1.xml,2.xml..4.xml文件。我经常在番茄花园听歌,也就是http://www.tomatolei.com,就想能不能把番茄的MP3资源放到这里来放呢?这不就是大家常说的MP3小偷的功能吗?说干就干! 1、分析一下番茄花园的歌来源: PageUrl = "htt转载 2006-08-29 11:34:00 · 2292 阅读 · 0 评论