爬虫：快速爬取一个网站

最新推荐文章于 2024-07-29 09:12:15 发布

随风 -

最新推荐文章于 2024-07-29 09:12:15 发布

阅读量2.2k

点赞数 1

文章标签：爬虫 python 开发语言

本文链接：https://blog.csdn.net/m0_59441281/article/details/127381186

版权

本次使用的是pycharm软件进行爬取的

首先要导入本次爬虫用到的包

from urllib.request import urlopen

然后确定你需要爬取网站的地址，我这边直接爬了百度的主页

代码如下

from urllib.request import urlopen
# 确定要爬取网址的路径
url = "http://www.baidu.com"
# 访问网址得到相应
resp = urlopen(url)
# 想得到内容
# decode 就是为了解码,以utf-8的形式解码
# print(resp.read().decode("utf-8"))
with open("mybaidu.html", mode="w", encoding="utf-8") as f:
    f.write(resp.read().decode("utf-8"))  # 从响应中读取到页面源代码
print("保存结束")

祝各位早日成为爬虫大佬！

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

随风 -

关注关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
打赏
1
评论
爬虫：快速爬取一个网站

f.write(resp.read().decode("utf-8")) # 从响应中读取到页面源代码。然后确定你需要爬取网站的地址，我这边直接爬了百度的主页。# decode 就是为了解码,以utf-8的形式解码。本次使用的是pycharm软件进行爬取的。首先要导入本次爬虫用到的包。print("保存结束")# 确定要爬取网址的路径。祝各位早日成为爬虫大佬！# 访问网址得到相应。
复制链接

扫一扫