笔记
文章平均质量分 65
xiao4-800k
这个作者很懒,什么都没留下…
展开
-
抓百度页面数据-终
新年刚过,还没从假期的懒散状态缓过来,就开始上班了,伸个懒腰,各位新年快乐~百度???这篇算翻不过去了朋友总是有很多奇怪的需求,这次他不但想要百度的数据,还希望抓更多其他搜索引擎的数据针对朋友后面可能会有其他的需求,我想了以下几种方案1. 割袍断义,绝交,这样以后都不会有任何需求了2. 在原有基础上追加新引擎处理方法3. 重构,将逻辑块封装后,外部脚本控制逻辑的扩展方式综合当前情况,我并没有太多时间,并且要抓的数据又多种多样,我选择了第一种,并将想法告诉了朋友。朋友发来了红包,我并不是那种原创 2021-02-19 12:15:43 · 1238 阅读 · 0 评论 -
抓百度下拉框内容
百度???你要干嘛朋友总是有很多奇怪的需求,这次他想要百度搜索智能提示的内容,就是这个至于他要干吗用,这个并没有太多去问,只是一时兴起,决定白嫖百度一下开门见山的说,白嫖不好,如果大家有能力还是去购买相应的接口,等我有钱了就买百度云在抓数据????如何做朋友给了我一个非常机智的方法0. 打开电脑,打开浏览器1. 让程序模拟用户操作,在浏览器的输入框中输入预存的词组2. 截取当前浏览器的显示截图3. 程序识别图中内容4. 将内容保存到本地至此完成一次操作,后续就是无限循环的抓取动作原创 2021-02-07 15:03:23 · 1532 阅读 · 0 评论 -
谷歌浏览器代理如何玩
谷歌浏览器代理如何玩在我们玩爬虫的时候,通常需要访问大量的站点,而对百度或者谷歌这类搜索引擎对爬虫通常都有着很强的限制比如当你的爬虫大量抓取百度的时候,百度会给你提示输入验证码等措施避免你频繁的访问,当然想要解决这种问题,有很多种方法,比如使用代理,对目标站点隐藏自己的信息,或者写对应的验证代码,通过验证限制当然我认为使用代理是比较方便,且直接的方法接下来就说说,我遇到的情况首先先说一下这个小工具的目标,通过批量输入要查询的站点域名,查询域名在不同搜索引擎中的收录情况包含:百度,谷歌,搜狗,原创 2021-02-01 18:05:02 · 2281 阅读 · 0 评论 -
关于《Go语言学习笔记》这本书
#关于《Go语言学习笔记》这本书书如其名,真的算是一本笔记,书中大量篇幅都是代码块,文字介绍较少,基础理论内容也很少,更多的是对某一些特性和一些用法上做实践,并且如果你细读的话也会发现一些写错的地方。如果非要嗑这本书 建议先看一遍**《Go by Example 中文版》**,对基本使用和语法有一定了解后再嗑笔者下卷部分并没有继续看,因为感觉还不到看源码的时候,所以再深造一段时间在回来看一下。这里粗略的整理一下知识点,没时间看这本书,可以看一下笔者整理的部分,并不全,也只是针对笔者感兴趣的地方进行原创 2021-02-01 18:01:07 · 1252 阅读 · 0 评论