- 博客(2)
- 资源 (1)
- 收藏
- 关注
转载 解析网页的request header
解析网页的request header Request Headers: 下图是我访问一个URL:http://www.hzau.edu.cn的一个header,根据具体实例来分析一下各部分的功能及其作用。 Accept 作用: 浏览器端可以接受的媒体类型, 例如: Accept: text/html 代表浏览器可以接受服务器回发的类型
2017-01-05 21:49:38 5735
转载 python 抓取网页
python 抓取网页 python网页抓取功能非常强大,使用urllib或者urllib2可以很轻松的抓取网页内容。但是很多时候我们要注意,可能很多网站都设置了防采集功能,不是那么轻松就能抓取到想要的内容。 今天我来分享下载python2和python3中都是如何来模拟浏览器来跳过屏蔽进行抓取的。 最基础的抓取: 1 #! /usr/bin/env pytho
2017-01-04 22:34:10 553
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人