背景
今天在论坛上回答一个问题的时候,需要用python写一个爬虫,但是在decode的时候报错误,说网页编码出现了问题,基于这个问题呢,我在网上查找了一番,找到了答案,今天来分享一下……
方法
在各种浏览器中,比如Google、Firefox、QQ浏览器、Mirosoft Edge、搜狗等浏览器上,在你想要查询网页编码的页面上,按F12功能键,即使用开发者工具,在窗口的Console标签下,输入命令
document.charset
,就会输出网页的编码方式,就是这样简单。
举例
我们随便以一个网页作为例子,就以我正在编写的这篇博客,通过F12打开开发者模式,然后找到Console标签,输入命令document.charset,我们便可以得到该网页的编码方式,这样我们后面要爬取这篇博文的时候,设置编码方式的时候就不会出错了!
---
好了,今天的小分享就到这里了,点点学习,点点进步,It's OK!