关于python网页编码问题

如何查看网页编码

我们可以右键查看网站源代码,在head里会包含这样一句话,chaeset后面就是网页的编码,这里就是utf8的编码

 <meta http-equiv=Content-Type content="text/html;charset=utf-8">

解决中文乱码问题

有的时候网站的编码是gbk或者gb2312,那么python抓取后结果是乱码,我们应该如何处理呢。我是查看了下面的链接的到了解答。链接如下。

【已解决】python中文字符乱码(GB2312,GBK,GB18030相关的问题)

解决的方法是这样的(下面是上面链接里的一段话):

请注意 gb2312 不是 “gb2312”,凡 gb2312 的请换成 gb18030. 
微软将 gb2312 和 gbk 映射为 gb18030,方便了一些人,也迷惑了一些人。

我是通过上面这种方法解决了我python编码的问题的。


这里推广一下我的一个关于数学mathematicapython教学的网站:文艺数学君

欢迎大家收藏我的网站并多多留言提出宝贵的意见。

当然你也可以联系我联系方式,给我投稿,希望在贡献者名单也可以看到你。


以上所有

2017 / 10 / 26

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值