爬虫。
文章平均质量分 72
natsuyu
这个作者很懒,什么都没留下…
展开
-
python模拟登陆知乎和CSDN【urllib,re,requests】
。。。。。。。。。。。。。 好心塞。。。。。。。。。。 。。。。。。。。。。。。。 HTTP协议方面现在懂得还很少,但是感觉比之前用socket的时候好多了,有个更加立体的了解!(⊙v⊙)嗯! 模拟登陆的思路很简单: 1、登录的时候有重要数据肯定是用post方法提交的,用各种方法找到post中的请求数据 2、用各种方法获取请求数据中的内容 3、处理头部和cookie,并带着请原创 2015-06-25 21:28:16 · 1553 阅读 · 0 评论 -
模拟登陆之填入cookie【python】
之前一直不懂有人提到的填入cookie是几个意思。。。 今天看到一个教程简单易懂。。然后试了一下发现。。果然分分钟就搞定了啊。。 在登录成功后的页面里面找到发送的cookie,然后对该页面发送该cookie。。over。 # !/usr/bin/env python # -*- coding:utf-8 -*- import urllib import urllib2 u原创 2015-07-10 16:20:57 · 784 阅读 · 0 评论 -
关于casperjs
我只能算会一点点的python,写一点点的爬虫……之前写爬虫都是分析http,然后模拟请求获取相关的数据。。但是已经好久没再写这个打杂了。前两天学弟找我,,说之前的代码不能用了。。我表示非常心塞。。。。。查了几个小时发现就是学校把域名变了= =。然后意识到这样的代码灵活度有点低,所以想着不然把casperjs学了,不再用这种老套的方法了。于是接触了下casperjs。 感觉性能方面貌似没有py原创 2016-05-17 16:17:40 · 556 阅读 · 0 评论