自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

书山有路勤为径

学海无涯苦作舟

  • 博客(4)
  • 资源 (1)
  • 问答 (14)
  • 收藏
  • 关注

原创 Go爬取起点中文网 解决文字反爬

Go语言的爬虫库不如Python强大,却也五脏俱全。今天我们分析如何爬取起点中文网数据,以及遇到反爬如何处理。作品链接:http://www.365yg.com/i6678092837810078222/#mid=1630225993665544代码已开源:https://github.com/shanewni/datavisble首先选择一款Go语言的爬虫框架,这里我选择的...

2019-04-13 14:39:26 1359

原创 Go如何处理文字反爬

文字反爬是反爬虫的一种常用手段。在Python中有专门的库可以使用,而Go没有此类库,只能通过别的手段解决文字反爬。在这给大家分享我的思路:1.如何判断是否为文字反爬呢如图所示,HTML界面显示方框打开页面源代码查找到对应位置,发现显示方框的位置有特殊的16进制字符串这里 𘞣𘞥𘞢&amp...

2019-04-13 14:38:01 1184

原创 go-创建HTTP/HTTPS IP池及如何使用

go有开源项目能够创建ip池,项目链接:ProxyPool类似的开源项目原理相同,通过爬取免费代理网页的ip端口数据,将有效数据持久化或者内存化供自己使用。在这里,我总结一下使用ProxyPool的细节,方便大家快速进入开发。一conf/app.ini配置文件从哪来。项目源代码中调用conf/app.ini文件,但是conf/下只有example_app.ini...

2019-04-05 15:46:35 1429

原创 Go获取Location重定向url

go本身不提供重定向的url,如果想要获取,只能从源码下手。http.Get()接收到一个url后,会进一步确认,是否包含重定向url,如果包含,自动转到新的url,我们需要做的就是在这之前截取重定向url。进入到http包中找到函数://自用,保留url地址信息,头部大写进行暴露var RedirectMy string //此行源码中没有,为自己添加func default...

2019-04-01 17:43:41 5316

mamppro4.0.1注册码亲测可用

mamppro4.0.1注册码亲测可用

2018-10-09

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除