- 博客(1)
- 资源 (4)
- 收藏
- 关注
原创 scrapy框架的一些问题
1.一定要注意编码,因为不少Unicode字符并不能在json文件中显示出来,所以在写程序的时候要考虑这一情况。 2.爬取网站内容的时候要注意伪装浏览器,伪造IP,写一个IP地址池,这些网上有不少资料可以参考,至于代理IP网上也有不少免费的,拿来就可以用 3.还有下载的延时时间也要设置,当然如果你做到上面一条,往往就不用担心自己的IP被ban,毕竟用的是代理IP。但是,作为一个
2016-10-28 09:01:24 491
Python核心编程
Python经典的一本书,作为一门面向编程语言,Python在大数据和机器学习领域都得到越来越多的应用,主要就在于它丰富多彩的功能库,真的很强大。想要学好Python的人就要来看看这本书了。
2017-09-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人