学习爬虫(第三天)

urllib模块

  • GET 特点 :查询参数在URL地址中显示
    用urllib模块get爬取百度贴吧的练习
    方式一(普通):在这里插入图片描述
    方式二(函数):在这里插入图片描述
    方式三(面向对象):在这里插入图片描述

  • POST

    • 在Request方法中添加data参数
    • urllib.request.Request(url,data=data,headers=headers)
    • data :表单数据以bytes类型提交,不能是str
      用urllib模块的post模拟有道翻译的练习
      在这里插入图片描述

requests模块

安装

• pip install requests
• 在开发工具中安装

requests.get(网址)

响应对象response的方法

• response.text 返回unicode格式的数据(str)
• response.content 返回字节流数据(二进制)
• response.content.decode(‘utf-8’) 手动进行解码
• response.url 返回url
• response.encode() = ‘编码’

requests模块发送 POST请求

用requests模块的post模拟有道翻译的练习
在这里插入图片描述

小知识:
1.range()可以让两个数的中间的数也可以一起进行for (1,3中间有2 range可以让123一起进行for)
2.range()是左包右不包型 所以呢如果想要把右边的数字也加进来就要 +1
3.requests模块的post一般不用字节,而urllib模块的post有的时候就会需要字节了
4.bytes()只能把字符串改成字节
功能函数
json.loads():可以让字符串变字典
bytes():可以让字典变成字节
urllib.parse.urlencode():把字典改成字符串

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值