- 博客(4)
- 收藏
- 关注
原创 Snoopy类库实现模拟登陆
在爬虫的过程中,很多时候需要登录后才能浏览一些网页。Snoopy类库可以方便地实现向服务器发送cookie,从而模拟登录状态。以下代码是模拟登录新浪微博,不过出于安全考虑,我的cookie字串没有展示出来~require_once ('Snoopy.class.php');$snoopy = new Snoopy();$cookieStr = " ";$snoopy->host
2016-01-24 17:08:39 478
原创 PHPCrawl爬虫库抓取酷狗歌单
爬虫抓取酷狗最近一月精选歌曲。由于抓取的数据量较小,所以没有考虑多进程什么的,不过我看了一下PHPCrawl的文档,发现PHPCrawl库已经把我能想到的功能都封装好了,实现起来很方便<?phpheader("Content-type:text/html;charset=utf-8");// It may take a whils to crawl a site ...set_time_li...
2016-01-24 16:05:20 2443
转载 Windows下搭建php开发环境
Apache : 首先修改Apache的配置文件,让Apache支持解析PHP文件。Apache配置文件在Apache安装目录的conf目录下的httpd.conf。1. 让Apache可以解析php文件,在配置文件中找到 #LoadModule vhost_alias_module modules/mod_vhost_alias.so在下一行添加 LoadModule php5
2016-01-17 20:18:46 559
原创 SESSION跨页传递问题
首先,我们要了解,在什么状态下SESSION中的会话变量不能跨页传递。情况有三:①客户端禁用了COOKIE;②在php.ini中设置了session.use_trans_sid=0或者在编译前没有开启--enable-trans-sid选项;③浏览器出现故障,暂时无法读写COOKIE文件。造成SESSION变量无法跨页进行传递,其原因在于SESSION储存于服务器端(默认以文件方式存储内容),
2016-01-17 19:45:21 2278
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人