golang 使用线程池进行高并发爬虫

golang 使用线程池进行高并发爬虫

gospider 介绍

gospider 是一个golang 爬虫神器,拥有python到golang爬虫过渡的所有必需库。用于python爬虫从业者快速且无坑的过渡到golang

安装

go get -u gitee.com/baixudong/gospider

gitee地址

https://gitee.com/baixudong/gospider

github地址

https://github.com/baixudong007/gospider

代码示例

package main

import (
	"context"
	"log"
	"net/url"

	"gitee.com/baixudong/gospider/requests"
	"gitee.com/baixudong/gospider/thread"
)

var reqCli *requests.Client

func init() {
	var err error
	reqCli, err = requests.NewClient(nil, requests.ClientOption{
		GetProxy: func(ctx context.Context, url *url.URL) (string, error) { //自动获取代理
			return "", nil
		},
	})
	if err != nil {
		log.Panic(err)
	}
}
func test(ctx context.Context, num int) {
	log.Printf("第%d个请求开始", num)
	resp, err := reqCli.Request(ctx, "get", "http://myip.top")
	if err != nil {
		log.Printf("第%d个请求失败%s", num, err.Error())
	} else {
		log.Printf("第%d个请求成功%d", num, resp.StatusCode())
	}
	log.Printf("第%d个请求结束", num)
}
func main() {
	threadCli := thread.NewClient(nil, 3) //限制并发为3
	for i := 0; i < 10; i++ {
		//读取任务
		threadCli.Write(&thread.Task{
			Func: test,
			Args: []any{i},
		})
	}
	threadCli.Join()
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值