爬虫抓取

最新推荐文章于 2024-07-12 16:42:46 发布

sunshine0625

最新推荐文章于 2024-07-12 16:42:46 发布

阅读量336

点赞数

分类专栏：【抓取】文章标签：爬虫

本文链接：https://blog.csdn.net/u012680593/article/details/52039112

版权

【抓取】专栏收录该内容

3 篇文章 0 订阅

订阅专栏

爬虫抓取的方式有两种：

1.简单

import urllib2
dir(urllib2)
urllib2.urlopen(url)
html=responce.read()

2.复杂

import urllib2
def make_opener(headers=None):
    cookie=cookielib.CookieJar()           
    opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie),urllib2.HTTPHandler)
    if headers:
         opener.addheades=headers
    else:
         opener.addheaders=[('User-Agent', 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; QQDownload 718)'),('Accept', 'text   /html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8')]
    return opener
opener=make_opener()
responce=opener.open(url,timeout=10)
html=responce.read()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

sunshine0625

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫抓取

爬虫抓取的方式有两种：1.简单import urllib2dir(urllib2)urllib2.urlopen(url)html=responce.read()2.复杂import urllib2def make_opener(headers=None): cookie=cookielib.CookieJar() opener=
复制链接

扫一扫