爬虫有时候爬取的中文是这种形式的乱码
'Èý±¦¹þ¶û±õÂ齫×÷±×Æ÷ÏÂÔØ'
我当时用的是request库,估计是requests.text自带的解码方式不对
所以要自己选择解码方式
当时网页上有这种代码
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
我就选了这种解码方式
requests.content.decode('gb2312')
发现没用
我就又试了gbk
requests.content.decode('gbk')
发现行了
'卓鱼济宁麻将作弊器'