Go-爬虫小例子

package main

import (
	"fmt"
	"io"
	"net/http"
	"os"
	"strconv"
	"time"
)

func main() {
 //指定爬取起始,终止页
 var start , end int
 fmt.Println("请输入起始页:")
 fmt.Scan(&start)
 fmt.Println("请输入爬取的终止页:")
 fmt.Scan(&end)

 working(start,end)
}

//爬取指定页面
func working(start,end int)  {

	var url string
	url="xxxxxx" //自己找一个url
	//循环爬取每一页的数据
	for i:=start;i<=end;i++{
		result, err := HttpGet(url)
		if err != nil {
			fmt.Println("httpget err ",err)
			continue
		}
		//将读到的数据保存成一个文件
		file, err := os.Create("第" + strconv.Itoa(i) + "页" + ".html")
		if err != nil {
			fmt.Println(err)
			continue
		}
		_, _ = file.WriteString(result)
		_ = file.Close()

	}
}

func HttpGet(url string)(result string,err error){
	resp, err := http.Get(url)
	if err != nil {
		fmt.Println(err)
		return
	}
	defer resp.Body.Close()
	time.Sleep(time.Second)
	//循环读取网页数据
	//缓冲区
	buf := make([]byte, 2048)
	for{
		n, err := resp.Body.Read(buf)
		if n==0{
			fmt.Println("读取网页完成")
			break
		}
		if err!=nil && err!=io.EOF {
			fmt.Println(err)
			return 
		}
		
		//累加每一次循环读取的 buf数据,存入result 一次性返回
		result+=string(buf[:n])
		
	}
	
	return 
	
	
	
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值