网络爬虫 正则cookie

  1. 捕获异常
  2. 正则表达式
  3. 网址访问
  4. 下载器
  5. cookie处理器

1.捕获异常
from urllib import request
from http import cookiejar

定义一个cookie

cookie = cookiejar.CookieJar()

定义一个cookie处理器,把cookie传进去

handler = request.HTTPCookieProcessor(cookie)

定义下载器,cookie处理器传进去

openner = request.build_opener(handler)

下载页面

resp = openner.open(‘http://www.baidu.com’)
for item in cookie:
print(‘NAME=’+item.name)
print(‘VALUE’+item.value)

  1. 正则表达式
    # 定义正则规则=模式,r表示原生字符串
    pattern = re.compile(r’hello’)

匹配字符,match函数会从第一个字母匹配

result1 = re.match(pattern, “hello hello”).span()
if result1:
print(result1)

  1. 网址访问
    import urllib.request

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值