扇贝单词
今天跟着老师爬取扇贝单词的网页版,是把网页内的单词及其翻译爬取到本地,并保存成 txt 文件,网页是这样的:
说一句题外话,真不知道老师咋弄到的这个网页,我自己找怎么也没找到老师的这个界面。先给你们网页链接:扇贝单词 。
那么下面进入正题:
开始同以往一样,导入包,获取 URL ,发起请求,获得响应:
url = 'https://www.shanbay.com/wordlist/110521/232414/?page=1'
response = requests.get(url=url).text
# print(response)
这里我们是把接收网页响应的 response 格式设置成了文本格式,因为到后面我们就可以直接使用 response 结果,不用再变格式了。打印出来我们发现是目标网页的源代码,并且也没有乱码,说明就没什