php起点小说小偷程序,PHP 简单的小偷程序

小偷程序:把远程网站上的数据(图片,网页及其他文件)抓取到本地,处理后再显示

正则表达式:用于字符串的模式分割 、匹配、查找及替换操作。

相关函数:

intereg(string$pattern,string$string[,array&$regs]

)

若省略参数返回的数组,找到则返回值为 True 否则 返回 False

与之对应 eregi() 不区分大小写。

stringfile_get_contents(string$filename[,bool$use_include_path=

false[,resource$context[,int$offset=

0[,int$maxlen]]]]

)

读取整个文件,比如:

用此函数可以获取网页信息

他就是小偷程序的基础。

比如:

$url=file_get_contents("http://www.ubuntu.org.cn/index_kylin");

echo $url;

?>

20160223234026_0845.png

但是对于另一个网站:

$url=file_get_contents("http://www.alangzhong.com/index.html");

echo $url;

?>

发现很多的背景图片是看不见的。

20160223234027_1158.png

查看网页源代码我们发现,这是

php-weizijiaocheng-326659.html

src="/upload/201503/b123ec26-bb8f-43be-b5ad-cdf45153d053.png"/>

图片的地址使用了相对路径,而我们本地没有这样的文件,当然显示不出来。

用正则表达式选定图片,然后远程地址替换相对路径:

下面代码的超时问题没有解决。

",$contents,$rg);

// 远程地址替换相对路径

$rg[1]=str_replace("src=\"../upload/","src=\"http://www.alangzhong.com/index.html/upload/",$rg[1]);

echo $rg[1];

?>

以上就介绍了PHP 简单的小偷程序,包括了方面的内容,希望对PHP教程有兴趣的朋友有所帮助。

本文原创发布php中文网,转载请注明出处,感谢您的尊重!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
看书啦小说小偷程序程序短小精悍,要一点点空间即可支持运行。运行环境:ASP 1M以内空间即可。 使用方法: 1、上传目录内所有文件到你的站点 2、用记事本打开conn.asp文件,进行设置    ①site_title = "某某小说网"       修改引号内的内容为你的站点名称,如:逆火小说网    ②site_url = "localhost:8080"     修改引号内的内容为你的站点域名,如:www.nihuo.net,注:前面不能含有HTTP://,后面不能含有斜杠“/”    ③site_Path = "/"     修改引号内的内容为小偷程序所在目录,如小偷在根目录设置为 / ,如小偷在根目录的 xiaoshou 文件夹内,就设置为 /xiaoshuo/ ,目录名前、后都要有 / ,如果在根目录,只要设置为 / 就可以了    ④site_miibeian = "日ICP备XXXXX号"  修改引号内的内容为你域名的备案号,如:京ICP备xxxxxx号    ⑤site_BBS = "http://www.XXX.com/bbs" 修改引号内的内容为你的论坛或留言本地址,使用绝对地址格式为:http://bbs.nihuo.net,如论坛或留言本在小偷程序所在目录的“bbs”文件夹内,可以使用相对地址,如: site_BBS = site_Path&"bbs"    ⑥M_title = "看书啦小说网|看书啦"   修改引号内的内容为目标站名称,如: 起点小说网,多个名称请用|符号进行分隔,如:起点小说网|起点文学网 ,通常情况下不需要修改    ⑦M_url = "http://www.kanshu.la"    修改引号内的内容为目标站网址,如:http://www.nihuo.net,后面不要加/ ,通常情况下不需要修改    ⑧M_img = "http://img.kanshu.la:88/" 修改引号内的内容为目标站图片服务器地址,如:ttp://images.nihuo.net/ ,后面必需有/ ,通常情况下不需要修改 3、修改网站图标,在images文件夹内,logo.gif与yd_logo.gif两个文件,前者是网站全局图标,后者是阅读页图标,可以用photoshop或Fireworks编辑为你自己的图标。
猎马搜索源码是一种用于搜索引擎优化(SEO)的开源程序。该程序的改良版称为火端搜索,它是基于原有的百度搜索引擎和好搜搜索引擎的爬虫程序。这个程序的作用是从互联网上抓取网页数据,并将其整理成可供搜索的索引。 猎马搜索源码(火端搜索改良版)的核心部分是使用PHP编写的爬虫程序。爬虫程序通过模拟人类对网页的访问,自动查找和下载网页,并将网页的内容存储到数据库中。该程序还会自动解析网页的链接,以便进一步抓取与之相关的页面。通过这种方式,猎马搜索实现了建立搜索引擎所需要的索引。 猎马搜索源码(火端搜索改良版)的另一个重要组成部分是搜索页面的前端设计。通过HTML、CSS和JavaScript等技术,将搜索结果以友好的方式展示给用户。用户可以在搜索框中输入关键词,并通过点击搜索按钮,触发后台查询相关的网页内容。搜索结果会按照相关度和其他算法进行排序,并以列表或磁贴等形式展示给用户。 猎马搜索源码(火端搜索改良版)具有一些优化功能。例如,它可以根据用户的搜索历史和行为,提供个性化的搜索结果。此外,它还采用了各种算法来过滤垃圾信息、提高搜索效率和准确度。 总的来说,猎马搜索源码(火端搜索改良版)是一种功能强大的搜索引擎优化工具,它利用PHP编写的爬虫程序获得网页数据,并通过前端设计展示给用户。通过优化和改良,猎马搜索源码能提供个性化搜索结果,并提高搜索效率和准确度。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值