作为公司平台团队的一员,我接触了很多文件处理的场景,比如管理一个通用文件上传中心服务,处理邮件附件,处理和导出大文件。在过去,这项工作要容易得多,因为我们可以完全支配整个服务器。我们可以写入一个文件让它持久化在服务器磁盘上,尽管这个作业所需的资源是非常多的。而现在,你的代码库是在更小的处理单元上发布的,比如 pods 。它的资源是虚拟分配的,并且在许多情况下是有限的,所以你需要知道如何有效地使用它们。实现优雅的处理和解决 OOM 退出问题也许对于那些已经熟悉自由地使用内存的人来说是一个大麻烦。
在我看来,Reader
和 Writer
是 Golang 最重要的部分。它给 goroutine 和并发处理提供了重要支持,是 Go 编程模型精简且具有良好性能的关键。因此,为了更进一步掌握 Go 编程语言,你应该能够优雅地操作 go buffers 和 goroutines。在本文中,我将讨论在文件上传到云存储引擎之前,处理从卫星客户端的文件流到中央文件上传器时遇到的问题。
Multipart 文件转发
在 Golang,如果你搜索任何类似 reader
操作,你应该得到过下面这些内容:
r := strings.NewReader("Go is a general-purpose language designed with systems
programming in mind.")
b, err := ioutil.ReadAll(r)
if err != nil {
log.Fatal(err)
}
// Playing with your loaded bytes
fmt.Printf("%s", b)
在你的代码中看到这样的东西是很常见的,因为在互联网上的许多实践都使用了这种方法。自从我第一次使用 Reader
,我也确实习惯了这样用。但是,如果你过度使用它,可能会对内存使用造成很大的损耗,这将极大地影响你可以处理的数据量。
典型场景当你读取的数据是已经预定义好格式的,这意味着在你读取它之后,还必须将它传递给另一个数据处理器再返回你的工作。你可能会使用的一种选择是 io.Copy
: