go爬虫
go爬虫
Clown95
a low coder
展开
-
使用 Chromedp 监听网页请求和响应
ChromeDP 是一个 Go 语言实现的库,它提供了无头浏览器的操作和控制能力,可以用来进行网页自动化、爬虫和测试等工作。通过 ChromeDP,我们可以编程方式监听网页上的各种事件,包括网络请求和响应。原创 2025-03-26 04:35:29 · 796 阅读 · 0 评论 -
go语言模拟网站登录并爬虫
title: go语言模拟网站登录并爬虫tags: go,爬虫想要学习爬虫的朋友知道,有时候我们需要爬的网站必须登录,才能获取到数据,那么我们该怎么模拟登录呢?下面我将使用我的分发平台作为演示:https://866w.cn打个小小的广告:签名、分发、web封装、安卓破解 咨询QQ:410258205需求我们登录上网站,并且选择应用管理。我们现在需要爬取我们账号下的所有...原创 2018-11-09 17:03:20 · 12493 阅读 · 3 评论 -
使用go语言提取ins视频地址和图片地址
先做下代码记录,具体细节有时间再说。package mainimport ( "bufio" "encoding/json" "fmt" "io/ioutil" "log" "net/http" "net/url" "os" "strings" "time")type Instargam struct { Data struct { User struct {...原创 2019-12-20 14:53:47 · 1331 阅读 · 0 评论 -
Go语言 检测代理IP是否有效
在使用网络爬虫时,代理 IP 是必不可少的工具。然而,并非所有的代理都是有效的,因此在使用代理之前,检测其可用性是非常重要的。我将展示如何用 Go 语言编写一个简单的代理 IP 检测工具,我们将通过访问一个测试地址来判断代理 IP 是否有效。如果返回的状态码为 200,即表示该代理可用。原创 2019-11-29 12:54:20 · 2566 阅读 · 0 评论 -
Go语言实现CSDN文章导出
title: Go语言实现CSDN文章导出tags: CSDN,Goauthor: Clown95背景我一直想把在CSDN上面发布的文章保存到本地,然后迁移到简书上。但是CSDN比较闭塞的就是官方不提供迁移接口。所以我只能寻找第三方工具,但是发现要么已经失效,要么就是使用不太友好(对我个人而言)。所以我花了半小时自己撸了一个go语言的导出工具分析我们先来分析如何获取到文章信息:1...原创 2019-11-16 15:14:32 · 668 阅读 · 1 评论 -
golang爬取Instagram内容下载地址
title: golang爬取Instagram内容下载地址tags: goauthor: Clown95前言应该是全网首发吧???如果转载请添加原作者信息。因为工作需要,需要获取一些小姐姐的图片和视频,然后就瞄上了ins。虽然可以利用一些插件保存图片和视频,但是这种方法不仅效率低,而且繁琐。因此就想通过程序来实现,搜索了一圈也没找到什么好的ins下载器,果断自己撸一个。其实ins获取到它的内容并不难,它就是使用json传递了信息。但是如果想要获得全部内容就比较麻烦,它的内容是通过动态加.原创 2020-05-26 01:02:29 · 2285 阅读 · 2 评论 -
go语言post提交数据
POST提交姓、名字,进行姓名评分package crawimport ( "fmt" "github.com/PuerkitoBio/goquery" "github.com/axgle/mahonia" "io/ioutil" "log" "net/http" "strings")func HttpPost(xing,ming string) string { enc:=mahonia.NewEncoder("gbk") xing =enc.ConvertString(原创 2020-08-18 15:46:21 · 1795 阅读 · 0 评论 -
instagram获取图片地址和视频地址
instagram 获取图片地址和视频地址先保持 以后在详细说明package mainimport ( "bufio" "encoding/json" "fmt" "github.com/unknwon/goconfig" "io/ioutil" "log" "net/http" "net/url" "os" "os/exec" "path/filepath" "strings" "time")var Queryhash stringvar Cookie str原创 2020-08-16 15:39:16 · 4462 阅读 · 2 评论 -
go语言抖音直播真实地址提取
package liveimport ( "GetRelLiveUrl/utils" "encoding/json" "fmt" "net/http" "regexp" "strings")type Dy struct { Data struct { Room struct { StreamURL struct { RtmpPullURL string `json:"rtmp_pull_url"` HlsPullURL string `原创 2020-09-28 14:25:43 · 3071 阅读 · 2 评论 -
Chromedp 绕过自动化检测(取消自动化提示)
使用chromdedp爬虫,绕过检测机制。原创 2023-02-28 18:58:28 · 1926 阅读 · 2 评论 -
go使用chromedp爬虫(旧)
title: go使用chromedp爬虫tags: go,chromedpauthor: Clown95背景最近朋友让我帮忙爬取一个网站上面的数据,当时看到页面觉得很简单,虽然有25000多页,但是网站没有反爬虫机制,只要多开几个协程就行。当我简单的爬取第一页之后,发现url没有page参数。好吧,查看翻页的源代码看看,javascript:__doPostBack('anpDa...原创 2019-04-11 09:07:18 · 13258 阅读 · 0 评论 -
chromedp 获取新选项卡内容
在使用网络爬虫时,尤其是使用 chromedp 库进行爬虫的过程中,我们可能会遇到点击某个链接后,目标页面在浏览器的新标签页或新窗口中打开的情况。这样的行为可能会导致我们无法直接获取新标签页中的内容,因为 chromedp 只会在原始的上下文(Context)中保持活动,而不能自动转到新打开的标签页。为了解决这个问题,我们需要监听新标签页的创建,这样便可以在新的上下文中操作新标签页的内容。原创 2021-07-26 01:48:36 · 3989 阅读 · 1 评论 -
Chromedp 显示浏览器窗
在使用chromedp库进行爬虫和自动化测试时,默认情况下浏览器以无头模式运行。这种模式虽然对大多数爬取任务有效,但在某些情况下,例如调试或特定的网页交互,切换到有头模式(即显示浏览器窗口)会更加方便。本文将介绍如何配置chromedp库以显示浏览器窗口并开启声音。原创 2021-07-26 01:59:39 · 2775 阅读 · 0 评论 -
chromedp 关于iframe的坑
起因最近在使用chromedp进行爬虫的时候,发现怎么都无法获取到内容,最终发现是因为使用了iframe,chromedp获取到iframe的内容,或者无法对iframe进行操作。方法我们可以使用·EvaluateAsDevTools或者Evaluate运行javascript来完成目标。1.获取iframe的内容var res string //存储js执行返回内容 err := chromedp.Run(ctx, // ._2ngM58AmonJc1uOl10jZ_H 大屏监控原创 2021-07-25 16:57:26 · 3004 阅读 · 1 评论 -
使用go chromedp爬虫
title: 使用go chromedp爬虫tags: go,chromedpauthor: Clown95背景最近小伙伴通过某些手段获取到了别人网站上的会员信息,所以他想让我把会员账号爬取下来。其实网站的内容很简单,但是难就难在不知道怎能控制翻页,它既不是通过url参数进行翻页,也不是通过ajax参数翻页。最终我选择chromedp这个库模拟浏览器操作,进行数据爬取。其实这个页...原创 2019-12-15 14:31:58 · 8321 阅读 · 1 评论
分享