Python爬虫:requests模块深入及案例

本文介绍了Python的requests模块在爬虫中的应用,包括使用requests.get携带参数进行CSDN搜索,利用requests.post请求百度翻译并处理响应的JSON数据,以及获取豆瓣电影排行榜信息。详细阐述了请求参数的封装、UA伪装、数据处理和存储过程。
摘要由CSDN通过智能技术生成
  • params:url携带的参数,字典类型

指定url发起请求是携带参数的,请求时将params中的字典类型数据转换为url中参数。

import requests

在CSDN中搜索,参数q为搜索关键字

searchURL = ‘https://so.csdn.net/so/search’

处理url携带的参数:封装到字典中

keyWord = input(‘CSDN Search KeyWord is :’)

param = {

请求所需的参数,字典类型

‘q’:keyWord

}

response = requests.get(url=searchURL ,params=param)

指定url发起请求是携带参数的,请求时将params中的字典类型数据转换为url中参数

pageText = response.text

爬取到的文本数据

fileName = keyWord + ‘.html’

with open(‘./dataFiles/’+fileName,‘w’,encoding=‘utf-8’) as fp:

fp.write(pageText)

生成以关键字命名的html文件

在这里插入图片描述

案例二:输入单词获取百度翻译的结果


在这里插入图片描述在这里插入图片描述

检查网页可知,百度翻译的请求方式为post,需要用到requests.post()。关键字为data里面的kw。

requests.post(url= ,data= ,headers= )

  • url:请求页面

  • data:关键字,字典类型

  • headers:头信息,字典类型,用于UA伪装

百度翻译

- post请求

- 响应数据是

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值