自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

猫i酒的博客

public technologies

  • 博客(2)
  • 资源 (1)
  • 收藏
  • 关注

原创 爬虫注意事项——不要冒法律风险

爬虫注意事项 1.遵守 Robots 协议,谨慎爬取 2.限制你的爬虫行为,禁止近乎 DDOS 的请求频率,一旦造成服务器瘫痪,约等于网络攻击 3.对于明显反爬,或者正常情况不能到达的页面不能强行突破,否则是 Hacker 行为 4.如果爬取到别人的隐私,立即删除,降低进局子的概率。另外要控制自己的欲望 ...

2020-04-21 09:29:21 1078

原创 XPath-----爬虫学习记录。爬取知名平台热榜

前言: 为了满足自己看一些时下热门的新闻的需求,但又觉得打开每个平台再去翻找有点麻烦。 正好顺便学了一下爬虫。 说明:python语言,xpath方法,windows平台 步骤: 先声明一下自己导入的库 1.准备好网站,并将自己要爬取的数据所在的位置记录一下 我爬取的是知乎、微博、贴吧的热门 知乎热榜: url_zhihu="https://www.zhihu.co...

2020-04-21 01:06:30 352

爬虫案例_5个.zip

各位努力的小伙伴,尽管拿去学习用,仅求好评,收藏更好。 主要内容如下: 1)百度百科轻巧版:简易获取词条信息;2) 爬取各平台热榜并发送到QQ好友:微博、贴吧、知乎;3)爬取拉勾网;4) QQ聊天清平专用; 5)爬取糗事百科并发送好友。

2021-07-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除