Golang爬虫

本文介绍了使用Go语言编写的一个基础爬虫程序,通过`read_website`函数获取用户输入的网站地址,获取网页源代码并存储在自定义包生成的HTML文件中。
摘要由CSDN通过智能技术生成

   不用多说,上代码:go爬虫

  解析:

// Spider.go
package main

import (
	"Spider/random"
	"bufio"
	"fmt"
	"io/ioutil"
	"net/http"
	"os"
)

var code string

func read_website() {
	var website string
	fmt.Scanf("%s", &website)
	resp, err := http.Get(website)
	if err != nil {
		fmt.Println("", err)
		return
	}
	body, err := ioutil.ReadAll(resp.Body)
	if err != nil {
		fmt.Println("抱歉,读取时出了一点小错误!", err)
		return
	}
	code = string(body)
}

func save_code() {
	random.Randint()
	filePath := "code/" + random.Number + ".html"
	file, err := os.OpenFile(filePath, os.O_WRONLY|os.O_CREATE, 0666)
	if err != nil {
		fmt.Println("抱歉,保存时出现了一些小错误", err)
	}
	defer file.Close()
	write := bufio.NewWriter(file)
	write.WriteString(code)
	write.Flush()
}

func main() {
	read_website()
	save_code()
}

  read_website()函数是用Scanf让用户输入要爬取的网站,接着把代码储存在变量code中。save_code()函数将变量code(网站源代码)储存在一个html文件中,之后便可在文件夹code中找到该文件,双击运行将发现效果和网站是一样的!Spider/random包是自定义包,用于生成保存的文件的文件名,具体代码见github项目(上面的链接)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值