- 博客(2)
- 收藏
- 关注
转载 python2.x 默认编码问题
python2.x中处理中文,是一件头疼的事情。网上写这方面的文章,测次不齐,而且都会有点错误,所以在这里打算自己总结一篇文章。我也会在以后学习中,不断的修改此篇博客。这里假设读者已有与编码相关的基础知识,本文不再再次介绍,包括什么是utf-8,什么是unicode,它们之间有什么关系。str与字节码首先,我们完全不谈unicode。 1 s = "...
2018-11-16 11:29:50 464
原创 超级无敌伪装技之User-Agent
python爬虫爬取网站内容时,如果什么也没带,即不带报头headers,往往会被网站管理维护人员认定为机器爬虫。因为,此时python默认的user-agent如Python-urllib/2.1一样。因此,网站管理人员会根据请求的user-agent判定你是不是机器爬虫。所以,此时往往就需要伪装user-agent,模拟成真实的浏览器去取出内容。下面是一些比较常用的浏览器的user-agent...
2018-11-14 10:25:41 3697
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人