python爬虫
文章平均质量分 65
handsome_gay
名字打错了。。。。。。。。是guy,手滑无一生...
展开
-
知乎爬虫之模拟登录
爬虫简单的原理就是发送一个请求到网站的服务器,服务器进行响应,然后从服务器响应的内容解析出我们想要的数据 这里我们将用requests库来发送请求(Windows上面在控制台通过pip3 install requests 进行安装), 解析可以用beautifulsoup库(用 pip3 install beautifulsoup安装),不过在这里暂时用不到解析, python版本是3第一步原创 2016-10-13 23:55:19 · 1131 阅读 · 0 评论 -
知乎爬虫之爬取专栏信息
接着昨天的模拟登陆,今天来爬取一下专栏信息 我们将对专栏https://zhuanlan.zhihu.com/Entertainmentlaw进行抓取 首先还是进行抓包分析,可以发现这里有我们想要的专栏的名称,作者,关注人数等信息 然后我们看一下消息头,看一下请求的URL和请求头 然后就可以编写代码了# -*- coding:utf-8 -*-__author__="weikair原创 2016-10-14 15:25:48 · 1012 阅读 · 0 评论