基于golang的小爬虫,爬取QQ邮箱号和QQ号

基于golang的小爬虫,爬取QQ邮箱号和QQ号


这个只是一个简单的版本只是获取QQ邮箱并且没有进行封装操作,另外爬出来的数据也没有进行去重操作


package main

import (
	"fmt"
	"io/ioutil"
	"log"
	"net/http"
	"regexp"
)

//这个只是一个简单的版本只是获取QQ邮箱并且没有进行封装操作,另外爬出来的数据也没有进行去重操作
var (
	// \d是数字
	reQQEmail = `(\d+)@qq.com`
)

// 处理异常
func HandleError(err error,why string) {
	if err != nil {
		fmt.Println(why, err)

	}
}
		// 爬邮箱
func GetEmail()  {
	// 1.去网站拿数据
	resp, err := http.Get("https://tieba.baidu.com/p/6051076813?red_tag=1573533731")
	HandleError(err,"http.Get url")
	defer resp.Body.Close()

	if resp.StatusCode != 200 {
		log.Fatalf("status code error: %d %s", resp.StatusCode, resp.Status)
	}

	// 2.读取页面内容
	pageBytes,err := ioutil.ReadAll(resp.Body)
	HandleError(err,"ioutil.ReadAll")

	// 字节转字符串
	pageStr := string(pageBytes)
	//fmt.Println(pageStr)
	// 3.过滤数据,过滤qq邮箱
	re := regexp.MustCompile(reQQEmail)
	// -1代表取全部
	results := re.FindAllStringSubmatch(pageStr,-1)
	//fmt.Println(results)

	// 遍历结果
	for _,v := range results {
		fmt.Println("email:",v[0])
		fmt.Println("email:",v[1])
	}
}

func main()  {
	GetEmail()
}

运行结果:


email: 1184822807@qq.com
email: 1184822807
email: 1184822807@qq.com
email: 1184822807
email: 598088118@qq.com
email: 598088118
email: 598088118@qq.com
email: 598088118
email: 835428013@qq.com
email: 835428013
email: 835428013@qq.com
email: 835428013
email: 934555653@qq.com
email: 934555653
email: 934555653@qq.com
email: 934555653
email: 695527214@qq.com
email: 695527214
email: 695527214@qq.com
email: 695527214
email: 410708076@qq.com
email: 410708076
email: 410708076@qq.com
email: 410708076
email: 55867960@qq.com
email: 55867960
email: 55867960@qq.com
email: 55867960
email: 2044989269@qq,com
email: 2044989269
email: 2044989269@qq,com
email: 2044989269
email: 823104483@qq.com
email: 823104483
email: 823104483@qq.com
email: 823104483
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

雨夜的博客

大赏给个咖啡钱

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值