初识爬虫 - xpath 简单应用（扇贝单词）

最新推荐文章于 2022-06-24 21:33:59 发布

来者不是客

最新推荐文章于 2022-06-24 21:33:59 发布

阅读量980

点赞数

分类专栏： Python 文章标签： python

本文链接：https://blog.csdn.net/qq_43305922/article/details/106674344

版权

本文介绍了如何使用Python爬虫和XPath解析技术，从扇贝单词网页抓取单词及其翻译，保存为TXT文件。通过示例代码详细讲解了获取网页源码、定位目标元素、提取信息及保存数据的过程。

摘要由CSDN通过智能技术生成

今天跟着老师爬取扇贝单词的网页版，是把网页内的单词及其翻译爬取到本地，并保存成 txt 文件，网页是这样的：

说一句题外话，真不知道老师咋弄到的这个网页，我自己找怎么也没找到老师的这个界面。先给你们网页链接：扇贝单词。

那么下面进入正题：

开始同以往一样，导入包，获取 URL ，发起请求，获得响应：

url = 'https://www.shanbay.com/wordlist/110521/232414/?page=1'

response = requests.get(url=url).text
# print(response)

这里我们是把接收网页响应的 response 格式设置成了文本格式，因为到后面我们就可以直接使用 response 结果，不用再变格式了。打印出来我们发现是目标网页的源代码，并且也没有乱码，说明就没什

关注

专栏目录