爬虫从入门到入预（1）

codting

已于 2022-03-19 15:09:42 修改

阅读量117

点赞数

分类专栏：爬虫文章标签：爬虫

于 2022-03-01 15:24:24 首次发布

本文链接：https://blog.csdn.net/weixin_43655132/article/details/123207039

版权

爬虫专栏收录该内容

22 篇文章 2 订阅

订阅专栏

从B站学习爬虫教学。

主要是爬一下百度主页的信息，然后将resp保存在html文件中，再用浏览器打开html文件。

出现的问题有：

使用open 函数时需要确定encoding的方式，不然写入html文件中会出现乱码现象。其实很好理解，就是说编码的时候不确定编码方式，那解码的时候就只能瞎蒙，也许OK，大概率乱码。其次，f.write使用完之后，记得用f.close。养成良好习惯。具体为啥现在还不知道！

总代码：

from urllib.request import urlopen

url="某个url"

resp=urlopen(url)

with open("mybaidu.html",mode="w",encoding="utf-8") as f:
    f.write(resp.read().decode("utf-8"))
    f.close()

print("over!")

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

codting

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫从入门到入预（1）

从B站学习爬虫教学。主要是爬一下百度主页的信息，然后将resp保存在html文件中，再用浏览器打开html文件。出现的问题有：使用open 函数时需要确定encoding的方式，不然写入html文件中会出现乱码现象。其实很好理解，就是说编码的时候不确定编码方式，那解码的时候就只能瞎蒙，也许OK，大概率乱码。其次，f.write使用完之后，记得用f.close。养成良好习惯。具体为啥现在还不知道！总代码：from urllib.request import urlopenur
复制链接

扫一扫