python编码获取

  不同的网站有不同的编码方式,同时,当我们从从服务器获取编码的编码可能跟网页中声明的编码又不一样,所有我们需要编写一个工具里来获取网页的编码方式
  这里主要说明一个获取编码的小工具chardet
  安装方式:pip install chardet (sudo)
  使用chardet.detect()方法

“`
# -- coding: utf-8 --

import urllib
import chardet

url = ‘http://www.jd.com

def getEncoding(url):
”’
@url:需要获取到的编码方式的链接:http://www.hao123.com
”’
html = urllib.urlopen(url)
data = html.read()
result = chardet.detect(data)
return result[‘encoding’]

def main():
print getEncoding(url)

if name == ‘main‘:
main()“`

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值