1--request模块

朝游碧海暮苍梧

已于 2022-02-19 20:48:10 修改

阅读量343

点赞数

分类专栏：爬虫文章标签：爬虫

于 2022-02-19 19:49:41 首次发布

本文链接：https://blog.csdn.net/qq_42530422/article/details/123022788

版权

爬虫专栏收录该内容

6 篇文章 2 订阅

订阅专栏

案例一、百度翻译

import requests
# 爬取网站：https://fanyi.baidu.com
url = "https://fanyi.baidu.com/sug"

s = input("请输入要翻译的英文单词")
dat = {
    "kw": s
}

# 发送post请求，发送的数据必须放在字典中，通过data参数进行传递
resp = requests.post(url, data=dat)
print(resp.json())

在这里插入图片描述

百度翻译在搜索时，sug里面的kw会发生变化，我们定义一个字典来改变这里的值

代码输出：
在这里插入图片描述

案例二、豆瓣排行榜

数据在没有在源代码中，需要js加载
在这里插入图片描述

其中js就在下方的网址中

Request URL: https://movie.douban.com/j/chart/top_list?type=24&interval_id=100%3A90&action=&start=0&limit=20

在这里插入图片描述
并且其中的封装的参数如下

其中，每一次加载数据，只有limit在更新

import requests

# 爬取网站 https://movie.douban.com/typerank?type_name=%E5%96%9C%E5%89%A7&type=24&interval_id=100:90&action=
# 需要加载的js地址：https://movie.douban.com/j/chart/top_list?type=24&interval_id=100%3A90&action=&start=0&limit=20
# #这个连接中？后的为数据
url = "https://movie.douban.com/j/chart/top_list"



# 重新封装参数
param = {
    "type": 24,
    "interval_id": "100:90",
    "action": "",
    "start": 0,
    "limit": 20
}

# resp = requests.get(url=url, params=param)
#
# # 输出地址
# print(resp.request.url)
#
# print(resp.request.headers)

# #重新定义User-Agent
header = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3878.400 QQBrowser/10.8.4518.400"
}
resp = requests.get(url=url, params=param, headers=header)
print(resp.text)
print(resp.json())
resp.close()   # 关掉resp

朝游碧海暮苍梧

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
1--request模块

百度翻译import requests# 爬取网站：https://fanyi.baidu.comurl = "https://fanyi.baidu.com/sug"s = input("请输入要翻译的英文单词")dat = { "kw": s}# 发送post请求，发送的数据必须放在字典中，通过data参数进行传递resp = requests.post(url, data=dat)print(resp.json())百度翻译在搜索时，sug里面的kw会发生变化，我
复制链接

扫一扫