Python爬虫
不会飞的渡渡鸟
这个作者很懒,什么都没留下…
展开
-
解决request获取网页之后的中文乱码问题
在爬取网页的时候经常使用到request库来获取网页的源码 request会根据网页中的编码方式来进行编码,但是有时request获取到的网页中中文出现了乱码,但是查看获取到的编码当时依旧是utf-8的编码。 按照其他的方法来指定编码方式为utf-8后并不能解决这个问题 response = requests.get(url, headers = headers) response....原创 2018-11-05 11:03:22 · 4400 阅读 · 0 评论 -
Windows下更新python的pip源
使用python默认的pip源安装文件时,有些文件的下载速度十分的缓慢,因此需要将pip的源更换为国内的源,这样的话就可以大大加快下载速度。 操作方法 1、Windows下进入C盘用户目录下,当前用户的目录 2、在该目录下新建文件夹pip 3、进入pip文件夹,新建文件pip.ini 4、打开pip.ini,输入以下参数并保存 [global] timeout = 6000 index-url...原创 2019-08-28 22:19:01 · 747 阅读 · 0 评论