Go 秒读32GB大文件

在Go中,处理大文件时,一般采用分块读取的方式,以避免一次性加载整个文件到内存中。

1、打开文件

使用os.Open打开文件 

package main

import (
	"log"
	"os"
)

func main() {
	file, err := os.Open("xxx.txt")
	if err != nil {
		log.Fatal(err)
	}
	defer file.Close()
}

2、获取文件信息

使用file.Stat获取文件的基本信息,包括文件大小

package main

import (
	"fmt"
	"log"
	"os"
)

func main() {
	file, err := os.Open("xxx.txt")
	if err != nil {
		log.Fatal(err)
	}
	defer file.Close()

	fileInfo, err := file.Stat()
	if err != nil {
		log.Fatal(err)
	}
	fileSize := fileInfo.Size()
	fmt.Println(fileSize)
}

3、设置缓冲区大小

为了提高读取效率,使用合适大小的缓冲区

package main

import (
	"fmt"
	"io"
	"log"
	"os"
)

func main() {
	//1、打开文件
	file, err := os.Open("xxx.txt")
	if err != nil {
		log.Fatal(err)
	}
	defer file.Close()

	//2、获取文件信息
	fileInfo, err := file.Stat()
	if err != nil {
		log.Fatal(err)
	}
	fileSize := fileInfo.Size()
	fmt.Println(fileSize)

	//3、设置缓冲区大小
	bufferSize := 8192 // 8KB 缓冲区大小
	buffer := make([]byte, bufferSize)
}

4、循环读取文件内容

使用file.Read循环读取文件内容 

package main

import (
	"fmt"
	"io"
	"log"
	"os"
)

func main() {
	//1、打开文件
	file, err := os.Open("xxx.txt")
	if err != nil {
		log.Fatal(err)
	}
	defer file.Close()

	//2、获取文件信息
	fileInfo, err := file.Stat()
	if err != nil {
		log.Fatal(err)
	}
	fileSize := fileInfo.Size()
	fmt.Println(fileSize)

	//3、设置缓冲区大小
	bufferSize := 8192 // 8KB 缓冲区大小
	buffer := make([]byte, bufferSize)

	//4、循环读取文件内容
	for {
		bytesRead, err := file.Read(buffer)
		if err == io.EOF {
			// 文件读取完毕
			break
		}
		if err != nil {
			log.Fatal(err)
		}

		// 处理读取的数据,例如输出到控制台
		fmt.Print(string(buffer[:bytesRead]))
	}
}

5、 关闭文件

package main

import (
	"fmt"
	"io"
	"log"
	"os"
)

func main() {
	//1、打开文件
	file, err := os.Open("xxx.txt")
	if err != nil {
		log.Fatal(err)
	}
	defer file.Close()//关闭

	//2、获取文件信息
	fileInfo, err := file.Stat()
	if err != nil {
		log.Fatal(err)
	}
	fileSize := fileInfo.Size()
	fmt.Println(fileSize)

	//3、设置缓冲区大小
	bufferSize := 8192 // 8KB 缓冲区大小
	buffer := make([]byte, bufferSize)

	//4、循环读取文件内容
	for {
		bytesRead, err := file.Read(buffer)
		if err == io.EOF {
			// 文件读取完毕
			break
		}
		if err != nil {
			log.Fatal(err)
		}

		// 处理读取的数据,例如输出到控制台
		fmt.Print(string(buffer[:bytesRead]))
	}
}

 6、案例

package main

import (
	"bufio"
	"fmt"
	"log"
	"os"
	"strings"
)

func main() {
	file, err := os.Open("large_file.txt")
	if err != nil {
		log.Fatal(err)
	}
	defer file.Close()

	const maxScanTokenSize = 64 * 1024 * 1024 // 64MB
	buf := make([]byte, maxScanTokenSize)

	scanner := bufio.NewScanner(file)
	scanner.Buffer(buf, maxScanTokenSize)

	for scanner.Scan() {
		line := scanner.Text()
		// 处理每一行的逻辑
		fmt.Println(line) //打印每一行

		fields := strings.Split(line, ",") // 假设使用逗号分隔
		// 处理fields中的每个字段
		for _, field := range fields {
			fmt.Println(field)
			// 可以添加更多处理逻辑
		}
	}

	if err := scanner.Err(); err != nil {
		log.Fatal(err)
	}
}

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值