献给学习小偷程序的朋友

很久没写过东西了,今天看了chinahuman 的《用asp自动解析网页中的图片地址,并将其保存到本地服务器》,于是优化了这个程序,并且将所有的功能都函数化了,希望对学习 XMLHTTP 的朋友有所帮助。
程序实现功能:自动将远程页面的文件中的图片下载到本地。

<%
'将本文保存为 save2local.asp
'测试:save2local.asp?url=http://ent.sina.com.cn/s/m/2003-11-11/1411231388.html
'本文根据 chinahuman 的《用asp自动解析网页中的图片地址,并将其保存到本地服务器》改编和优化
'自动创建目录,自动将原文件名更名,文件格式的限制以及其他功能的一些优化
'自动保存网页文件中 http://.... 格式的图片到本地
'转载请注明出处:http://www.jaron.cn http://www.csdn.net/develop
'参数设置开始
url = request("url")
localaddr = server.MapPath("images_remote/") '保存到本地的目录
localdir = "images_remote/" 'http 访问的相对路径
AllowFileExt = "jpg|bmp|png|gif" '支持的文件名格式
'参数设置完毕

if createdir(localaddr) = false then
response.Write "创建目录失败,请检查目录权限"
response.End
end if
response.Write Convert2LocalAddr(url,localaddr,localdir)

function Convert2LocalAddr(url,localaddr,localdir)
'参数说明
'url 页面地址
'localaddr 保存本地的物理地址
'localdir 相对路径
strContent = getHTTPPage(url)
Set objRegExp = New Regexp
objRegExp.IgnoreCase = True
objRegExp.Global = True
objRegExp.Pattern = "<img.+?>"
Set Matches =objRegExp.Execute(strContent)
For Each Match in Matches
RetStr = RetStr & GetRemoteImages(Match.Value)
Next
ImagesArray=split(RetStr,"||")
RemoteImage=""
LocalImage=""
for i=1 to ubound(ImagesArray)
if ImagesArray(i)<>"" and instr(RemoteImage,ImagesArray(i))<1 then
fname=baseurl&cstr(i&mid(ImagesArray(i),instrrev(ImagesArray(i),".")))
ImagesFileName = ImagesArray(i)
AllowFileExtArray = split(AllowFileExt,"|")
isGetFile = false
for tmp = 0 to ubound(AllowFileExtArray)
if lcase(GetFileExt(ImagesFileName)) = ALlowFileExtArray(tmp) then
isGetFile=True
end if
next
if isGetFile = true then
newfilename = GenerateRandomFileName(fname)
call Save2Local(ImagesFileName,localaddr & "/" & newfilename)
RemoteImage=RemoteImage&"||"& ImagesFileName
LocalImage=LocalImage&"||" & localdir & newfilename
end if
end if
next
arrnew=split(LocalImage,"||")
arrall=split(RemoteImage,"||")
for i=1 to ubound(arrnew)
strContent=replace(strContent,arrall(i),arrnew(i))
next
Convert2LocalAddr = strContent
end function

function GetRemoteImages(str)
Set objRegExp1 = New Regexp
objRegExp1.IgnoreCase = True
objRegExp1.Global = True
objRegExp1.Pattern = "http://.+? "
set mm=objRegExp1.Execute(str)
For Each Match1 in mm
tmpaddr = left(Match1.Value,len(Match1.Value)-1)
GetRemoteImages=GetRemoteImages&"||" & replace(replace(tmpaddr,"""",""),"'","")
next
end function

function getHTTPPage(url)
on error resume next
dim http
set http=Server.createobject("Msxml2.XMLHTTP")
Http.open "GET",url,false
Http.send()
if Http.readystate<>4 then exit function
getHTTPPage=bytes2BSTR(Http.responseBody)
set http=nothing
if err.number<>0 then err.Clear
end function

Function bytes2BSTR(vIn)
dim strReturn
dim i,ThisCharCode,NextCharCode
strReturn = ""
For i = 1 To LenB(vIn)
ThisCharCode = AscB(MidB(vIn,i,1))
If ThisCharCode < &H80 Then
strReturn = strReturn & Chr(ThisCharCode)
Else
NextCharCode = AscB(MidB(vIn,i+1,1))
strReturn = strReturn & Chr(CLng(ThisCharCode) * &H100 + CInt(NextCharCode))
i = i + 1
End If
Next
bytes2BSTR = strReturn
End Function

function getHTTPimg(url)
on error resume next
dim http
set http=server.createobject("MSXML2.XMLHTTP")
Http.open "GET",url,false
Http.send()
if Http.readystate<>4 then exit function
getHTTPimg=Http.responseBody
set http=nothing
if err.number<>0 then err.Clear
end function

function Save2Local(from,tofile)
dim geturl,objStream,imgs
geturl=trim(from)
imgs=gethttpimg(geturl)
Set objStream = Server.CreateObject("ADODB.Stream")
objStream.Type =1
objStream.Open
objstream.write imgs
objstream.SaveToFile tofile,2
objstream.Close()
set objstream=nothing
end function

function geturlencodel(byval url)'中文文件名转换
Dim i,code
geturlencodel=""
if trim(Url)="" then exit function
for i=1 to len(Url)
code=Asc(mid(Url,i,1))
if code<0 Then code = code + 65536
If code>255 Then
geturlencodel=geturlencodel&"%"&Left(Hex(Code),2)&"%"&Right(Hex(Code),2)
else
geturlencodel=geturlencodel&mid(Url,i,1)
end if
next
end function

Function GenerateRandomFileName(ByVal szFilename) '根据原文件名,自动以日期YYYY-MM-DD-RANDOM格式生成新文件名
Randomize
ranNum = Int(90000 * Rnd) + 10000
If Month(Now) < 10 Then c_month = "0" & Month(Now) Else c_month = Month(Now)
If Day(Now) < 10 Then c_day = "0" & Day(Now) Else c_day = Day(Now)
If Hour(Now) < 10 Then c_hour = "0" & Hour(Now) Else c_hour = Hour(Now)
If Minute(Now) < 10 Then c_minute = "0" & Minute(Now) Else c_minute = Minute(Now)
If Second(Now) < 10 Then c_second = "0" & Second(Now) Else c_second = Minute(Now)
fileExt_a = Split(szFilename, ".")
FileExt = LCase(fileExt_a(UBound(fileExt_a)))
GenerateRandomFileName = Year(Now) & c_month & c_day & c_hour & c_minute & c_second & "_" & ranNum & "." & FileExt
End Function

Function CreateDIR(ByVal LocalPath) '建立目录的程序,如果有多级目录,则一级一级的创建
On Error Resume Next
LocalPath = Replace(LocalPath, "/", "/")
Set FileObject = server.CreateObject("Scripting.FileSystemObject")
patharr = Split(LocalPath, "/")
path_level = UBound(patharr)
For I = 0 To path_level
If I = 0 Then pathtmp = patharr(0) & "/" Else pathtmp = pathtmp & patharr(I) & "/"
cpath = Left(pathtmp, Len(pathtmp) - 1)
If Not FileObject.FolderExists(cpath) Then FileObject.CreateFolder cpath
Next
Set FileObject = Nothing
If Err.Number <> 0 Then
CreateDIR = False
Err.Clear
Else
CreateDIR = True
End If
End Function

function GetfileExt(byval filename)
fileExt_a=split(filename,".")
GetfileExt=lcase(fileExt_a(ubound(fileExt_a)))
end function
%>

有一点要注意的是,这里只是分析了以 http开头的图片的地址。否则不下载图片,可以转换一下地址就行了,再提供几个小函数,分析地址用的:

Function findurl(thisurl)
if thisurl <> "" Then
findurl=""
strlen=InStr(8,thisurl,"/")
If strlen=0 Then strlen =1
findurl=Mid(thisurl,strlen,28)
end if
end Function

function findurlpath(thisurl)
thisurl = replace(thisurl,"//","@@")
ary_tmp = split(thisurl,"/")
for tmp = 0 to ubound(ary_tmp)
if tmp < ubound(ary_tmp) then
urltmp = urltmp & "/" & ary_tmp(tmp)
end if
next
urltmp = right(urltmp,len(urltmp)-1)
findurlpath = replace(urltmp,"@@","//") & "/"
end function

function findurlhost(thisurl)
thisurl = replace(thisurl,"//","@@")
ary_tmp = split(thisurl,"/")
urltmp = ary_tmp(0)
findurlhost = replace(urltmp,"@@","//") & "/"
findurlhost = left(findurlhost,len(findurlhost)-1)
end function

先选中一个你想 “偷” 的网页程序。。。
我这里看中了它。。呵呵 。。。很多妹妹图片。。。口水中。。
http://www.linkmm.com/photo/ads2.html
然后建立个ASP网页,先把以下代码复制进去
<%Function bytes2BSTR(vIn)
strReturn = ""
For i = 1 To LenB(vIn)
ThisCharCode = AscB(MidB(vIn,i,1))
If ThisCharCode < &H80 Then
strReturn = strReturn & Chr(ThisCharCode)
Else
NextCharCode = AscB(MidB(vIn,i+1,1))
strReturn = strReturn & Chr (CLng(ThisCharCode) * &H100 + CInt(NextCharCode))
i = i + 1
End If
Next
bytes2BSTR = strReturn
End Function

Url = "http://www.linkmm.com/photo/ads2.html";;;
set oSend=createobject("Microsoft.XMLHTTP")
SourceCode = oSend.open ("GET",url,false)
oSend.send()
if err.number<>0 then
Response.write err.description
Response.End()
end if
SourceCode = bytes2BSTR(oSend.responseBody)%>

其中Url = "http://www.linkmm.com/photo/ads2.html";;;就是你想要 偷 的网页,换成你需要的就可以了。。
这个时候response.write 一下。。是不是很多图片看不见啊。。不急,我们有replace呢。。把你现在的网页查看下原文件
把原来的网页查看下愿文件对比下就知道怎么让这些无法显示的显示出来。。。比起那些一个个replace替换图片的方法
用这个方法好多了就是在有src的地方在他前面直接替换网址多方便呵呵。。
在写这段代码。。程序就完了呵呵
<%baseurl1="http://www.linkmm.com/photo";;;
SourceCode =replace(sourcecode,"src=""img/","src=""http://www.linkmm.com/photo/img/";;;)
SourceCode =replace(sourcecode,"new.gif",baseurl1&"/new.gif")
SourceCode =replace(sourcecode,"href=""photo888","href=""http://www.linkmm.com/photo/photo888";;;)
SourceCode =replace(sourcecode,"site.css","http://www.linkmm.com/photo/site.css";;;)
response.write SourceCode%>

是不是很简单啊。不懂的联系我52596464
完整代码如下:
<html>
<head>
<meta name="GENERATOR" content="Microsoft FrontPage 5.0">
<meta name="ProgId" content="FrontPage.Editor.Document">
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<meta http-equiv="refresh" content="3600">
<title></title>
</head>

<body>
<%
Function bytes2BSTR(vIn)
strReturn = ""
For i = 1 To LenB(vIn)
ThisCharCode = AscB(MidB(vIn,i,1))
If ThisCharCode < &H80 Then
strReturn = strReturn & Chr(ThisCharCode)
Else
NextCharCode = AscB(MidB(vIn,i+1,1))
strReturn = strReturn & Chr (CLng(ThisCharCode) * &H100 + CInt(NextCharCode))
i = i + 1
End If
Next
bytes2BSTR = strReturn
End Function

Url = "http://www.linkmm.com/photo/ads2.html";;;
set oSend=createobject("Microsoft.XMLHTTP")
SourceCode = oSend.open ("GET",url,false)
oSend.send()
if err.number<>0 then
Response.write err.description
Response.End()
end if
SourceCode = bytes2BSTR(oSend.responseBody)
baseurl1="http://www.linkmm.com/photo";;;
SourceCode =replace(sourcecode,"src=""img/","src=""http://www.linkmm.com/photo/img/";;;)
SourceCode =replace(sourcecode,"new.gif",baseurl1&"/new.gif")
SourceCode =replace(sourcecode,"href=""photo888","href=""http://www.linkmm.com/photo/photo888";;;)
SourceCode =replace(sourcecode,"site.css","http://www.linkmm.com/photo/site.css";;;)
response.write SourceCode
%>
</body>
</html>

 

 

小偷程序原理和简单示例
现在网上流行的小偷程序比较多,有新闻类小偷,音乐小偷,下载小偷,那么它们是如何做的呢,
下面我来做个简单介绍,希望对各位站长有所帮助。

(一)原理
小偷程序实际上是通过了XML中的XMLHTTP组件调用其它网站上的网页。
比如新闻小偷程序,很多都是调用了sina的新闻网页,并且对其中的html进行了一些替换,
同时对广告也进行了过滤。用小偷程序的优点有:无须维护网站,因为小偷程序中的数据来自其他网站,它将随着该网站的更新而更新;可以节省服务器资源,一般小偷程序就几个文件,所有网页内容都是来自其他网站。
缺点有:不稳定,如果目标网站出错,程序也会出错,而且,如果目标网站进行升级维护,那么小偷程序也要进行相应修改;
速度,因为是远程调用,速度和在本地服务器上读取数据比起来,肯定要慢一些。

(二)事例

下面就XMLHTTP在ASP中的应用做个简单说明

<%
'常用函数
'1、输入url目标网页地址,返回值getHTTPPage是目标网页的html代码
function getHTTPPage(url)
dim Http
set Http=server.createobject("MSXML2.XMLHTTP")
Http.open "GET",url,false
Http.send()
if Http.readystate<>4 then
exit function
end if
getHTTPPage=bytesToBSTR(Http.responseBody,"GB2312")
set http=nothing
if err.number<>0 then err.Clear
end function

'2、转换乱玛,直接用xmlhttp调用有中文字符的网页得到的将是乱玛,可以通过adodb.stream组件进行转换
Function BytesToBstr(body,Cset)
dim objstream
set objstream = Server.CreateObject("adodb.stream")
objstream.Type = 1
objstream.Mode =3
objstream.Open
objstream.Write body
objstream.Position = 0
objstream.Type = 2
objstream.Charset = Cset
BytesToBstr = objstream.ReadText
objstream.Close
set objstream = nothing
End Function

'下面试着调用http://www.3doing.com/earticle/的html内容
Dim Url,Html
Url="http://www.3doing.com/earticle/";
Html = getHTTPPage(Url)
Response.write Html
%>

如何写ASP入库小偷程序

作者:allen
转载请注明出自玛雅论坛


最近大家都对小偷程序感兴趣,尤其是入库类的,在这里我简单的介绍一下。希望大家对这个能有所了解,如果您还不知道什么叫小偷,请参考我写的另外一片文章(小偷程序原理和简单示例
):http://www.cnmaya.org/viewthread.php?tid=68&fpage=1

个人认为小偷只是一个很通俗的说法,也给很多人带来了误解,认为小偷是什么不好的东西,
其实不然,用数据采集程序来形容应该更准确些。

这里是我昨天刚完成的新浪娱乐入库小偷程序::http://www.saynew.com/news/Class/popjb/popjb02.html
在这里我根据该程序的制作简单介绍一下:

入库小偷的原理也很简单:就是用XMLHTTP远程读取网页的内容,然后根据需要,对读到的内容进行加工(过滤,替换,分类),最后得到自己需要的数据,加入到数据库中。

首先:我们先用XMLHTTP读取远程网页(我的另一片文章中有介绍)。
其次:对内容进行过滤,这个是比较关键的步骤,比如说,我要从远程网页上提取出所有url连接,我应该怎么做呢?

‘这里用的是正则式
Set objRegExp = New Regexp '建立对象
objRegExp.IgnoreCase = True '大小写忽略
objRegExp.Global = True '全局为真
objRegExp.Pattern = "http://.+?"; '匹配字段
set mm=objRegExp.Execute(str) '执行查找,str为输入参数
For Each Match in mm '进入循环
Response.write(Match.Value) '输出url地址
next

然后,我们需要根据需要做一些替换功能,把不必要的数据替换掉,这个比较简单,用Replace函数即可。
最后,进行数据库操作,这个我想大家应该都会,就不做介绍了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
绕看漫画小偷程序,免费完全开源,新手可以学习用,2011.11.30更新全站程序为完全开源版,代码完全公开,适合初级学习;可以用于交流修改和二次开发;无任何加密文件,可以任意修改了;本站会陆续更新所有程序为开源免费版,支持二次开发。 目标站是:raokan 更新速度还可以,主要是图片没经过防盗链,容易被采集。 广告比较少,界面不是太漂亮,很一般的那种。 他的漫画资源倒是不少,不过有个很大的缺点与那些专门的漫画站比,就是速度不好,为什么? 因为,他的站的图片是一个ip里面的,不像其他大站,图片分为好几个服务器,会根据客户ip不同自动调整服务器ip,力求找到最优的速度服务器. 这个站是我大学时候的东西了,有几年了。。 属于古董级的东西了。大家不嫌弃的话,就下载研究研究,很简单,也许你看了代码后也完全可以仿照着写出小偷程序了呢。 代码写法经过整合,完全适合新手参考,相同代码归类,一目了然。 下面说说本程序的修改方法: 本程序无后台,修改网站信息,找到config.asp这个文件,用记事本打开,可以看到下面的代码: 这些代码没行后面都有相应的注释,按照注释进行修改就可以了。 其他的文件一般不用修改 其他文件想修改的话,要用记事本打开相应的文件。 我举个例子就成了,比如 头部文件 head.asp ,用记事本打开,看到如下: 以上这些里面的网址啥的都是可以修改的,等等吧,自己看着办了,网址和汉字都还是可以看懂的吧。。 说说广告问题: 广告都是js调用的,我这里也没仔细看过哪个是管的哪个广告,里面的js文件都可以用记事本打开看看,如果里面是广告网址的话,那么他就是广告文件了,记得js广告文件,必须代码是经过js转换后的。 Tags: 漫画小偷 4dzz小偷 asp小偷

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值