- 博客(2)
- 资源 (1)
- 收藏
- 关注
原创 爬虫注意事项——不要冒法律风险
爬虫注意事项1.遵守 Robots 协议,谨慎爬取2.限制你的爬虫行为,禁止近乎 DDOS 的请求频率,一旦造成服务器瘫痪,约等于网络攻击3.对于明显反爬,或者正常情况不能到达的页面不能强行突破,否则是 Hacker 行为4.如果爬取到别人的隐私,立即删除,降低进局子的概率。另外要控制自己的欲望...
2020-04-21 09:29:21 1120
原创 XPath-----爬虫学习记录。爬取知名平台热榜
前言:为了满足自己看一些时下热门的新闻的需求,但又觉得打开每个平台再去翻找有点麻烦。正好顺便学了一下爬虫。说明:python语言,xpath方法,windows平台步骤:先声明一下自己导入的库1.准备好网站,并将自己要爬取的数据所在的位置记录一下我爬取的是知乎、微博、贴吧的热门知乎热榜:url_zhihu="https://www.zhihu.co...
2020-04-21 01:06:30 381
爬虫案例_5个.zip
2021-07-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人