用Golang写爬虫(一)

前言近期有些项目需要用到Golang,大概花了一周来看语法,然后就开始看爬虫相关的。这里记录下如何使用Golang来写爬虫的几个步骤,最终完成的效果如下图环境安装比较简单sudoapt...
摘要由CSDN通过智能技术生成

前言

近期有些项目需要用到Golang,大概花了一周来看语法,然后就开始看爬虫相关的。这里记录下如何使用Golang来写爬虫的几个步骤,最终完成的效果如下图

环境

安装比较简单

sudo apt-get install golang  # (Linux)

brew install go  # (Mac)

安装之后注意`GOPATH`和`GOROOT`等环境变量设置,IDE用的是jetbrains家的GoLand。

建议先去看看Golang的官方文档,学习基本语法知识。地址:官方教程中文版、https://tour.go-zh.org/welcome/1

创建文档

新建文件`crawler.go`,并写入如下代码:

package main

import "fmt"

func main() {
    fmt.Println("Hello, world")
}

运行方法:`go run crawler.go `,肉眼可见,编译速度比JAVA要快得多。

下载网页

这里先从Golang原生http库开始,直接使用`net/http`包内的函数请求

import "net/http"
...
resp, err := http.Get("http://wwww.baidu.com")

所以代码可以这样写

package main

import (
    "fmt"
    "io/ioutil"
    "net/http"
)

func main() {
    fmt.Println("Hello, world")
    resp, err := http.Get("http://www.baidu.com/")
    if err != nil {
        fmt.Println("http get error", err)
        return
    }
    body, err := ioutil.ReadAll(resp.Body)
    if err != nil {
        fmt.Println("read error", err)
        return
    }
    fmt.Println(string(body))
}

Golang的错误处理就是这样的,习惯就好。

这里更好的做法是把下载方法封装为函数。

package main

import (
    "fmt"
    "io/ioutil"
    "net/http"
)

func main() {
    fmt.Println("Hello,
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值