go爬虫实践 获取图片

本文介绍如何使用Go和goquery库进行网页图片爬虫的实践,通过遍历HTML中img标签的src属性来抓取并保存图片。示例代码展示了从新浪网站抓取图片的过程,主线程设置延迟以防止goroutine泄漏。
摘要由CSDN通过智能技术生成

一般图片的位置都藏在html中img的src标签里,所有我们可以遍历html的img标签,获取并存取,我采用了goquery一个很不错的解析html的库
下面上代码,爬的的是新浪的,主线程sleep是为了防止goroutine泄漏,当然也可以通过通道避免

package main

import (
    "github.com/PuerkitoBio/goquery"
    "fmt"
    "os"
//  "log"
    "path"
    "strings"
    "regexp"
    "math/rand"
    "io"
    "net/http"
    "time"
)

func randFileName(dirPath string,suffix string) (fileName string) {
    var randChar string = "abcdefghimnjkqzxyt0123456789ioedkaldncalew0129387iue"
    var name string
    size := 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值