- 博客(2)
- 资源 (1)
- 收藏
- 关注
原创 爬虫注意事项——不要冒法律风险
爬虫注意事项 1.遵守 Robots 协议,谨慎爬取 2.限制你的爬虫行为,禁止近乎 DDOS 的请求频率,一旦造成服务器瘫痪,约等于网络攻击 3.对于明显反爬,或者正常情况不能到达的页面不能强行突破,否则是 Hacker 行为 4.如果爬取到别人的隐私,立即删除,降低进局子的概率。另外要控制自己的欲望 ...
2020-04-21 09:29:21
1078
原创 XPath-----爬虫学习记录。爬取知名平台热榜
前言: 为了满足自己看一些时下热门的新闻的需求,但又觉得打开每个平台再去翻找有点麻烦。 正好顺便学了一下爬虫。 说明:python语言,xpath方法,windows平台 步骤: 先声明一下自己导入的库 1.准备好网站,并将自己要爬取的数据所在的位置记录一下 我爬取的是知乎、微博、贴吧的热门 知乎热榜: url_zhihu="https://www.zhihu.co...
2020-04-21 01:06:30
352
爬虫案例_5个.zip
2021-07-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人