爬虫案例_Python

最新推荐文章于 2024-07-30 21:09:58 发布

LunYanLi

最新推荐文章于 2024-07-30 21:09:58 发布

阅读量492

点赞数 4

文章标签： python paddle 微信公众平台 segmentfault facebook

本文链接：https://blog.csdn.net/2401_86075647/article/details/140741812

版权

网络爬虫，也称为网页蜘蛛或网络机器人，是一种按照一定规则自动浏览和检索网页信息的程序或脚本。

网络爬虫在现代社会中扮演着至关重要的角色，其功能和应用范围广泛且多样。从搜索引擎的构建到数据分析，再到信息的自动化采集，网络爬虫作为一种高效的信息获取工具，正逐渐成为大数据时代不可或缺的技术手段。

以下是一个爬虫🦎代码；

import requests
base_url = 'https://fanyi.baidu.com/sug'
kw = input('请输入要翻译的英文单词：')
data = {
'kw': kw
}
headers = {
'Content-Type': 'application/x-www-form-urlencoded',
'Referer': 'https://fanyi.baidu.com/',
'X-Requested-With': 'XMLHttpRequest'
}
try:
response = requests.post(base_url, headers=headers, data=data)
response.raise_for_status() # 检查响应状态码是否为200
result = response.json()
if result['errno'] == 0: # 检查是否成功获取数据
translations = result['data']
result = '\n'.join([i['v'] for i in translations])
print(f"{kw}的翻译结果为：")
print(result)
else:
print(f"请求失败，错误码：{result['errno']}，错误信息：{result['errmsg'].decode()}")
except requests.RequestException as e:
print(f"请求失败：{e}")

这是一个使用Python的requests库编写的简单程序，用于查询百度翻译API并获取输入英文单词的中文翻译结果。以下是代码的详细解释：

1. 首先，导入requests库，这是一个用于发送HTTP请求的Python库。

2. 设置基础URL（base_url）为百度翻译的API地址：'https://fanyi.baidu.com/sug'。

3. 通过input()函数提示用户输入要翻译的英文单词，并将其存储在变量kw中。

4. 创建一个名为data的字典，其中包含一个键'kw'，其值为用户输入的英文单词。

5. 创建一个名为headers的字典，其中包含三个键值对，用于设置请求头信息。这些信息包括：内容类型（'Content-Type'）、引用页面（'Referer'）和请求方式（'X-Requested-With'）。

6. 使用try-except语句捕获可能发生的异常。在try块中执行以下操作：

a. 使用requests.post()函数发送POST请求，将base_url、headers和data作为参数传递。

b. 使用response.raise_for_status()方法检查响应状态码是否为200，如果不是，则抛出异常。

c. 使用response.json()方法将响应内容解析为JSON格式，并将结果存储在result变量中。

d. 检查result中的'errno'键的值是否为0，如果为0，表示成功获取数据。然后从result中提取翻译结果，并将其存储在translations变量中。

e. 使用列表推导式从translations中提取每个翻译结果的值（'v'键对应的值），并使用'
'.join()方法将它们连接成一个字符串。将结果存储在result变量中。

f. 打印出输入的英文单词及其翻译结果。

g. 如果'errno'的值不为0，表示请求失败，此时打印出错误码和错误信息。

7. 在except块中捕获requests.RequestException异常，并打印出请求失败的原因。

LunYanLi

关注

4
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
爬虫案例_Python

这些信息包括：内容类型（'Content-Type'）、引用页面（'Referer'）和请求方式（'X-Requested-With'）。d. 检查result中的'errno'键的值是否为0，如果为0，表示成功获取数据。print(f"请求失败，错误码：{result['errno']}，错误信息：{result['errmsg'].decode()}")e. 使用列表推导式从translations中提取每个翻译结果的值（'v'键对应的值），并使用''.join()方法将它们连接成一个字符串。
复制链接

扫一扫