Golang 1.16 新特性-embed 包及其使用

1. Golang 1.16 新特性-embed 包及其使用

1.1. embed 是什么

embed 是在 Go 1.16 中新加入的包。它通过 //go:embed 指令, 可以在编译阶段将静态资源文件打包进编译好的程序中, 并提供访问这些文件的能力。

1.2. 为什么需要 embed 包

在以前, 很多从其他语言转过来 Go 语言的同学会问到, 或者踩到一个坑。就是以为 Go 语言所打包的二进制文件中会包含配置文件的联同编译和打包。

结果往往一把二进制文件挪来挪去, 就无法把应用程序运行起来了。因为无法读取到静态文件的资源。

无法将静态资源编译打包二进制文件的话, 通常会有两种解决方法:

  • 第一种是识别这类静态资源, 是否需要跟着程序走。
  • 第二种就是将其打包进二进制文件中。

第二种情况的话, Go 以前是不支持的, 大家就会借助各种花式的开源库, 例如: go-bindata/go-bindata 来实现。

但是在 Go1.16 起, Go 语言自身正式支持了该项特性。

它有以下优点

  • 能够将静态资源打包到二进制包中, 部署过程更简单。传统部署要么需要将静态资源与已编译程序打包在一起上传, 或者使用 docker 和 dockerfile 自动化前者, 这是很麻烦的。
  • 确保程序的完整性。在运行过程中损坏或丢失静态资源通常会影响程序的正常运行。
  • 静态资源访问没有 io 操作, 速度会非常快。

1.3. embed 的常用场景

  • Go 模版: 模版文件必须可用于二进制文件(模版文件需要对二进制文件可用)。对于 Web 服务器二进制文件或那些通过提供 init 命令的 CLI 应用程序, 这是一个相当常见的用例。在没有嵌入的情况下, 模版通常内联在代码中。
  • 静态 web 服务: 有时, 静态文件(如 index.html 或其他 HTML, JavaScript 和 CSS 文件之类的静态文件)需要使用 golang 服务器二进制文件进行传输, 以便用户可以运行服务器并访问这些文件。
  • 数据库迁移: 另一个使用场景是通过嵌入文件被用于数据库迁移脚本。

1.4. embed 的基本用法

embed 包是 golang 1.16 中的新特性, 所以, 请确保你的 golang 环境已经升级到了 1.16 版本。

Go embed 的使用非常简单, 首先导入 embed 包, 再通过 //go:embed 文件名 将对应的文件或目录结构导入到对应的变量上。

特别注意: embed 这个包一定要导入, 如果导入不使用的话, 使用 _ 导入即可。

嵌入的这个基本概念是通过在代码里添加一个特殊的注释实现的, Go 会根据这个注释知道要引入哪个或哪几个文件。注释的格式是:

//go:embed FILENAME(S)

FILENAME 可以是 string 类型也可以是 []byte 类型, 取决于你引入的是单个文件、还是 embed.FS 类型的一组文件。go:embed 命令可以识别 Go 的文件格式, 比如 files/*.html 这种文件格式也可以识别到(但要注意不要写成 **/*.html 这种递归的匹配规则)。

文件格式 https://pkg.go.dev/path#Match

可以看下官方文档的说明。https://golang.org/pkg/embed/

embed 可以嵌入的静态资源文件支持三种数据类型: 字符串、字节数组、embed.FS 文件类型

数据类型说明
[]byte表示数据存储为二进制格式, 如果只使用 []bytestring 需要以 import (_ "embed") 的形式引入 embed 标准库
string表示数据被编码成 utf8 编码的字符串, 因此不要用这个格式嵌入二进制文件比如图片, 引入 embed 的规则同 []byte
embed.FS表示存储多个文件和目录的结构, []bytestring 只能存储单个文件

1.5. embed 例子

例如: 在当前目录下新建文件 version.txt, 并在文件中输入内容: 0.0.1

将文件内容嵌入到字符串变量中

package main
 
import (
    _ "embed"
    "fmt"
)
 
//go:embed version.txt
var version string
 
func main() {
    fmt.Printf("version: %q\n", version)
}

当嵌入文件名的时候, 如果文件名包含空格, 则需要用引号将文件名括起来。如下, 假设文件名是 “version info.txt”, 如下代码第 8 行所示:

package main
 
import (
    _ "embed"
    "fmt"
)
 
//go:embed "version info.txt"
var version string
 
func main() {
    fmt.Printf("version: %q\n", version)
}

将文件内容嵌入到字符串或字节数组类型变量的时候, 只能嵌入 1 个文件, 不能嵌入多个文件, 并且文件名不支持正则模式, 否则运行代码会报错

如代码第 8 行所示:

package main
 
import (
    _ "embed"
    "fmt"
)
 
//go:embed version.txt info.txt
var version string
 
func main() {
    fmt.Printf("version %q\n", version)
}

运行代码, 得到错误提示:

sh-3.2# go run .
# demo
./main.go:8:5: invalid go:embed: multiple files for type string

1.6. 软链接&硬链接

嵌入指令是否支持嵌入文件的软链接呢? 如下: 在当前目录下创建一个指向 version.txt 的软链接 v

ln -s version.txt v
package main
 
import (
    _ "embed"
    "fmt"
)
//go:embed v
var version string
func main() {
    fmt.Printf("version %q\n", version)
}

运行程序, 得到不能嵌入软链接文件的错误:

sh-3.2# go run .# demomain.go:8:12: pattern v: cannot embed irregular file vsh-3.2#

结论: //go:embed 指令不支持文件的软链接

让我们再来看看文件的硬链接, 如下:

sh-3.2# rm v
sh-3.2# ln version.txt h
import (
    _ "embed"
    "fmt"
)
//go:embed v
var version string
 
func main() {
    fmt.Printf("version %q\n", version)
}

运行程序, 能够正常运行并输出, 如下:

sh-3.2# go run .version 0.0.1

结论: //go:embed 指令支持文件的硬链接。因为硬链接本质上是源文件的一个拷贝。

我们能不能将嵌入指令用于 初始化的变量呢? 如下:

package main
 
import (
    _ "embed"
    "fmt"
)
 
//go:embed v
var version string = ""
 
func main() {
    fmt.Printf("version %q\n", version)
}

运行程序, 得到 error 结果:

sh-3.2# go run ../main.go:12:3: go:embed cannot apply to var with initializersh-3.2#

结论: 不能将嵌入指令用于已经初始化的变量上。

将文件内容嵌入到字节数组变量中

package main
 
import (
    _ "embed"
    "fmt"
)
//go:embed version.txt
var versionByte []byte
 
func main() {
    fmt.Printf("version %q\n", string(versionByte))
}

1.7. 将文件目录结构映射成 embed.FS 文件类型

使用 embed.FS 类型, 可以读取一个嵌入到 embed.FS 类型变量中的目录和文件树, 这个变量是只读的, 所以是线程安全的。

embed.FS 结构主要有 3 个对外方法, 如下:

// Open 打开要读取的文件, 并返回文件的 fs.File 结构。
func (f FS) Open(name string) (fs.File, error)
 
// ReadDir 读取并返回整个命名目录
func (f FS) ReadDir(name string) ([]fs.DirEntry, error)
 
// ReadFile 读取并返回 name 文件的内容。
func (f FS) ReadFile(name string) ([]byte, error)

1.8. 读取单个文件

package main
 
import (
    "embed"
    "fmt"
    "log"
)
 
//go:embed "version.txt"
var f embed.FS
 
func main() {
    data, err := f.ReadFile("version.txt")
    if err != nil {
        log.Fatal(err)
    }
 
    fmt.Println(string(data))
}

1.9. 读取多个文件

首先, 在项目根目录下建立 templates 目录, 以及在 templates 目录下建立多个文件, 如下:

|-templates
|-—— t1.html
|——— t2.html
|——— t3.html
package main
 
import (
    "embed"
    "fmt"
    "io/fs"
)
 
//go:embed templates/*
var files embed.FS
 
func main() {
    templates, _ := fs.ReadDir(files, "templates")
    
    //打印出文件名称
    for _, template := range templates {
        fmt.Printf("%q\n", template.Name())
    }
}

1.10. 嵌入多个目录

通过使用多个 //go:embed 指令, 可以在同一个变量中嵌入多个目录。我们在项目根目录下再创建一个 cpp 目录, 在该目录下添加几个示例文件名。如下:

|-cpp
|——— cpp1.cpp
|——— cpp2.cpp
|——— cpp3.cpp

如下代码, 第 9、10 行所示:

package main
 
import (
    "embed"
    "fmt"
    "io/fs"
)
 
//go:embed templates/*
//go:embed cpp/*
var files embed.FS
 
func main() {
    templates, _ := fs.ReadDir(files, "templates")
    
    //打印出文件名称
    for _, template := range templates {
        fmt.Printf("%q\n", template.Name())
    }
    
    cppFiles, _ := fs.ReadDir(files, "cpp")
    for _, cppFile := range cppFiles {
        fmt.Printf("%q\n", cppFile.Name())
    }
}

1.11. 按正则嵌入匹配目录或文件

只读取 templates 目录下的 txt 文件, 如下代码第 9 行所示:

package main
 
import (
    "embed"
    "fmt"
    "io/fs"
)
 
//go:embed templates/*.txt
var files embed.FS
 
func main() {
    templates, _ := fs.ReadDir(files, "templates")
    
    //打印出文件名称
    for _, template := range templates {
        fmt.Printf("%q\n", template.Name())
    }
}

只读取 templates 目录下的 t2.htmlt3.html 文件, 如下代码第 9 行所示:

package main
 
import (
  "embed"    
  "fmt"    
  "io/fs"
 )
 
 //go:embed templates/t[2-3].txt
 var files embed.FS
 
 func main() {
     templates, _ := fs.ReadDir(files, "templates")
     //打印出文件名称    
     for _, template := range templates {
       fmt.Printf("%q\n", template.Name())    
     }
 }

1.12. 在 http web 中的使用

package main
 
import (
   "embed"
   "net/http"
)
 
//go:embed static
var static embed.FS
 
func main() {
   http.ListenAndServe(":8080", http.FileServer(http.FS(static)))
}

http.FS 这个函数, 把 embed.FS 类型的 static 转换为 http.FileServer 函数可以识别的 http.FileSystem 类型。

1.13. 在模板中的应用

package main
 
import (
   "embed"
   "html/template"
   "net/http"
)
 
//go:embed templates
var tmpl embed.FS
 
func main() {
   t, _ := template.ParseFS(tmpl, "templates/*.tmpl")
   http.HandleFunc("/", func(rw http.ResponseWriter, r *http.Request) {
      t.ExecuteTemplate(rw,"index.tmpl",map[string]string{"title":"Golang Embed 测试"})
   })
   http.ListenAndServe(":8080",nil)
}

template 包提供了 ParseFS 函数, 可以直接从一个 embed.FS 中加载模板, 然后用于 HTTP Web 中。模板文件夹的结构如下所示:

templates
└── index.tmpl

1.14. Gin 静态文件服务

package main
 
import (
   "embed"
   "github.com/gin-gonic/gin"
   "net/http"
)
 
//go:embed static
var static embed.FS
 
func main() {
   r:=gin.Default()
   r.StaticFS("/",http.FS(static))
   r.Run(":8080")
}

在 Gin 中使用 embed 作为静态文件, 也是用过 http.FS 函数转化的。

1.15. Gin HTML 模板

package main
 
import (
   "embed"
   "github.com/gin-gonic/gin"
   "html/template"
)
 
//go:embed templates
var tmpl embed.FS
 
//go:embed static
var static embed.FS
 
func main() {
   r:=gin.Default()
   t, _ := template.ParseFS(tmpl, "templates/*.tmpl")
   r.SetHTMLTemplate(t)
   r.GET("/", func(ctx *gin.Context) {
      ctx.HTML(200,"index.tmpl",gin.H{"title":"Golang Embed 测试"})
   })
   r.Run(":8080")

和前面的模板例子一样, 也是通过 template.ParseFS 函数先加载 embed 中的模板, 然后通过 Gin 的 SetHTMLTemplate 设置后就可以使用了。

http.FS 函数是一个可以把 embed.FS 转为 http.FileSystem 的工具函数

1.16. embed 的使用实例-一个简单的静态 web 服务

以下搭建一个简单的静态文件 web 服务为例。在项目根目录下建立如下静态资源目录结构

|-static
|---js
|------util.js
|---img
|------logo.jpg
|---index.html
package main
 
import (
    "embed"    
    "io/fs"   
    "log"    
    "net/http"    
    "os"
)
 
func main() {
    useOS := len(os.Args) > 1 && os.Args[1] == "live"    
    http.Handle("/", http.FileServer(getFileSystem(useOS)))   
    http.ListenAndServe(":8888", nil)
}
 
//go:embed static
var embededFiles embed.FS
 
func getFileSystem(useOS bool) http.FileSystem {
    if useOS {
      log.Print("using live mode")        
      return http.FS(os.DirFS("static"))    
    }    
    
    log.Print("using embed mode")    
    fsys, err := fs.Sub(embededFiles, "static")    
    if err != nil {
      panic(err)    
    }    
    
    return http.FS(fsys)
 }

以上代码, 分别执行 go run . livego run .

然后在浏览器中运行 http://localhost:8888 默认显示 static 目录下的 index.html 文件内容。

当然, 运行 go run . livego run . 的不同之处在于编译后的二进制程序文件在运行过程中是否依赖 static 目录中的静态文件资源。

以下为验证步骤:

首先, 使用编译到二进制文件的方式。

若文件内容改变, 输出依然是改变前的内容, 说明 embed 嵌入的文件内容在编译后不再依赖于原有静态文件了。

  1. 运行 go run .
  2. 修改 index.html 文件内容为 Hello China
  3. 浏览器输入 http://localhost:8888 查看输出。输出内容为修改之前的 Hello World

其次, 使用普通的文件方式。

若文件内容改变, 输出的内容也改变, 说明编译后依然依赖于原有静态文件。

  1. go run . live
  2. 修改 index.html 文件内容为 delete
  3. 浏览器输入 http://localhost:8888 查看输出。输出修改后的内容: Hello China

1.17. embed 使用中注意事项

在使用 //go:embed 指令的文件都需要导入 embed 包。

例如, 以下例子没有导入 embed 包, 则不会正常运行 。

package main
 
import (
    "fmt"
)
 
//go:embed file.txt
var s string
 
func main() {
    fmt.Print(s)
}

//go:embed 指令只能用在包一级的变量中, 不能用在函数或方法级别, 像以下程序将会报错, 因为第 10 行的变量作用于属于函数级别:

package main
 
import (
    _ "embed"    
    "fmt"
)
 
func main() {
    //go:embed file.txt    
    var s string    
    fmt.Print(s)
}

当包含目录时, 它不会包含以 “.” 或 “_” 开头的文件。

但是如果使用通配符, 比如 dir/*, 它将包含所有匹配的文件, 即使它们以 “.” 或 “_” 开头。请记住, 在您希望在 Web 服务器中嵌入文件但不允许用户查看所有文件的列表的情况下, 包含 Mac OS 的 .DS_Store 文件可能是一个安全问题。出于安全原因, Go 在嵌入时也不会包含符号链接或上一层目录。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
这段代码片段是根据命令行参数来进行一些设置和路径的初始化。 首先,根据 `torch.cuda.is_available()` 的返回值判断是否支持 GPU,并将结果赋给 `args.cuda` 变量,即如果支持 GPU,则 `args.cuda` 为 `True`,否则为 `False`。 然后,将 `args.model_name` 和 `args.classify_type` 的值分别赋给 `model_name` 和 `classify_type` 变量。 接下来,根据 `args.embedding` 的值来确定 `embedding` 的取值。如果 `args.embedding` 为 `'random'`,则将 `embedding` 设置为 `'random'`,否则设置为 `'word2vec'`。 然后,根据 `model_name` 的值判断是否使用 FastText 模型,并根据需要引入相应的工具模块。 接下来是一系列的路径设置: - `path_corpus` 是存放数据文件的路径,根据 `dataname` 来确定。 - `path_output` 是结果输出的路径,根据 `dataname` 来确定。 - `logdir` 是日志文件存放的路径,括了 `dataname`、`classify_type`、`model_name` 和 `useType`。 - `saved_dict` 是模型保存的路径,括了 `dataname`、`classify_type`、`model_name` 和 `useType`。 - `embed_dir` 是嵌入向量文件保存的路径,括了 `dataname`、`classify_type`、`model_name` 和 `useTypes`。 最后,通过调用 `makedirs()` 函数来创建这些路径所对应的文件夹。 这段代码的目的是根据命令行参数来进行一些设置和路径的初始化,以便后续的程序运行能够正确读取和保存相关的文件。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

云满笔记

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值