编码
mycar001
这个作者很懒,什么都没留下…
展开
-
自学Python八 爬虫大坑之网页乱码
Bug有时候破坏的你的兴致,阻挠了保持到现在的渴望。可是,自己又非常明白,它是一种激励,是注定要被你踩在脚下的垫脚石! python2.7中最头疼的可能莫过于编码问题了,尤其还是在window环境下,有时候总是出现莫名其妙的问题,有时候明明昨天还好好的,今天却突然。。。遇到这种问题真的是一肚子的火。。。fuck! 首先,在我们编写python代码的时候就要注意一些编码的规范。转载 2017-10-20 16:10:34 · 304 阅读 · 0 评论 -
Python 抓取网页学习系列之一(网页编码格式
第一步:你需要知道你所抓取的网页编码格式,方法:右键查看网页编码,ctrl +F ,搜索:charset会看到:gbk" />,OK确定是gbk编码格式了;为什么会提到编码,这里大概讲讲原理: 我们看到的所有字符,在计算机里面都是用01010101二进制编码,然后你要想在屏幕上看到ABCD,计算机需要指定某个特定的二进制串来对应ABCD,比如A是011,0100是B等,每个字母都转载 2017-10-20 16:15:46 · 968 阅读 · 0 评论 -
encode和decode
字符串在Python内部的表示是unicode编码. 在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再unicode编码(encode)成另一种编码。 decode的作用是将其他编码的字符串转换成unicode编码, 如str1.decode('gb2312'),表示将gb2312编码的字符串转换成unicod转载 2017-11-03 17:25:18 · 395 阅读 · 0 评论