35.数据序列化
序列化与反序列化
我们的数据对象要在网络中传输或保存到文件,就需要对其编码和解码动作,目前存在很多编码格式:json,XML,Gob,Google Protocol Buffer等,Go 语言当然也支持所有这些编码格式。
序列化 (Serialization)是将对象的状态信息转换为可以存储或传输的形式的过程。在序列化期间,对象将其当前状态写入到临时或持久性存储区。通过从存储区中读取对象的状态,重新创建该对象,则为反序列化。
简单地说把某种数据结构转为指定数据格式为“序列化”或“编码”(传输之前);而把“指定数据格式”转为某种数据结构则为“反序列化”或“解码”(传输之后)。
在Go语言中,encoding/json标准包处理json数据的序列化与反序列化问题。
json数据序列化函数主要有:json.Marshal()
func Marshal(v interface{}) ([]byte, error) {
e := newEncodeState()
err := e.marshal(v, encOpts{escapeHTML: true})
if err != nil {
return nil, err
}
buf := append([]byte(nil), e.Bytes()...)
e.Reset()
encodeStatePool.Put(e)
return buf, nil
}
从上面的Marshal()函数我们可以看到,数据结构序列化后返回的是字节数组,而字节数组很容易通过网络传输或写入文件存储。而且在Go中,Marshal()默认是设置escapeHTML = true的,会自动把 ‘<’, ‘>’, 以及 ‘&’ 等转化为"\u003c" , "\u003e"以及 “\u0026”。
json数据反序列化函数主要有:UnMarshal()
func Unmarshal(data []byte, v interface{}) error // 把 json 解码为数据结构
从上面的UnMarshal()函数我们可以看到,反序列化是读取字节数组,进而解析为对应的数据结构。
注意:不是所有的数据都可以编码为 json 格式,只有验证通过的数据结构才能被编码:
json 对象只支持字符串类型的 key;要编码一个 Go map 类型,map 必须是 map[string]T(T是 json包中支持的任何类型)
channel,复杂类型和函数类型不能被编码
不支持循环数据结构; 它将引起序列化进入一个无限循环
指针可以被编码,实际上是对指针指向的值进行编码(或者指针是 nil)
而在Go中,json 与 Go 类型对应如下:
bool 对应 json 的 booleans
float64 对应 json 的 numbers
string 对应 json 的strings
nil 对应 json 的 null
在解析 json 格式数据时,若以 interface{} 接收数据,需要按照以上规则进行解析。
json数据格式
在Go语言中,利用encoding/json标准包将数据序列化为json数据格式这个过程简单直接,直接使用json.Marshal(v)来处理任意类型,序列化成功后得到一个字节数组。
反过来我们将一个json数据来反序列化或解码,则就不那么容易了,下面我们一一来说明。
(一)将json数据反序列化到结构体:
这种需求是最常见的,在我们知道 json 的数据结构前提情况下,我们完全可以定义一个或几个适当的结构体并对 json 数据反序列化。例如:
package main
import (
"encoding/json"
"fmt"
)
type Human struct {
name string `json:"name"` // 姓名
Gender string `json:"s"` // 性别,性别的tag表明在json中为s字段
Age int `json:"Age"` // 年龄
Lesson
}
type Lesson struct {
Lessons []string `json:"lessons"`
}
func main() {
//name 不会被解析出来,因为name是小写字段不会被解析出来 要解析的话将结构体name改为Name
jsonStr := `{"Age": 18,"name": "Jim" ,"s": "男",
"lessons":["English","History"],"Room":201,"n":null,"b":false}`
var hu Human
if err := json.Unmarshal([]byte(jsonStr), &hu); err == nil {
fmt.Println("\n结构体Human")
fmt.Println(hu)
}
var le Lesson
if err := json.Unmarshal([]byte(jsonStr), &le); err == nil {
fmt.Println("\n结构体Lesson")
fmt.Println(le)
}
jsonStr = `["English","History"]`
var str []string
if err := json.Unmarshal([]byte(jsonStr), &str); err == nil {
fmt.Println("\n字符串数组")
fmt.Println(str)
} else {
fmt.Println(err)
}
}
输出:
结构体Human
{ 男 18 {[English History]}}
结构体Lesson
{[English History]}
字符串数组
[English History]
我们定义了2个结构体Human和Lesson,结构体Human的Gender字段tag标签为:json:“s”,表明这个字段在json中的名字对应为s。而且结构体Human中嵌入了Lesson结构体。
jsonStr 我们可以认作为一个json数据,通过json.Unmarshal,我们可以把json中的数据反序列化到了对应结构体,由于结构体Human的name字段不能导出,所以并不能实际得到json中的值,这是我们在定义结构体时需要注意的,字段首字母大写。
对json中的Age,在结构体Human对应Age int,不能是string。另外,如果是json数组,可以把数据反序列化给一个字符串数组。
总之,知道json的数据结构很关键,有了这个前提做反序列化就容易多了。而且结构体的字段并不需要和json中所有数据都一一对应,定义的结构体字段可以是json中的一部分。
(二)反序列化任意json数据:
encoding/json 包使用 map[string]interface{} 和 []interface{} 储存任意的 json 对象和数组;其可以被反序列化为任何的 json blob 存储到接口值中。
直接使用 Unmarshal 把这个数据反序列化,并保存在map[string]interface{} 中,要访问这个数据,我们可以使用类型断言:
package main
import (
"encoding/json"
"fmt"
)
func main() {
jsonStr := `{"Age": 18,"name": "Jim" ,"s": "男","Lessons":["English","History"],"Room":201,"n":null,"b":false}`
var data map[string]interface{}
if err := json.Unmarshal([]byte(jsonStr), &data); err == nil {
fmt.Println("map结构")
fmt.Println(data)
}
for k, v := range data {
switch vv := v.(type) {
case string:
fmt.Println(k, "是string", vv)
case bool:
fmt.Println(k, "是bool", vv)
case float64:
fmt.Println(k, "是float64", vv)
case nil:
fmt.Println(k, "是nil", vv)
case []interface{}:
fmt.Println(k, "是array:")
for i, u := range vv {
fmt.Println(i, u)
}
default:
fmt.Println(k, "未知数据类型")
}
}
}
程序输出:
map结构
map[Age:18 Lessons:[English History] Room:201 b:false n:<nil> name:Jim s:男]
b 是bool false
Age 是float64 18
name 是string Jim
s 是string 男
Lessons 是array:
0 English
1 History
Room 是float64 201
n 是nil <nil>
通过这种方式,即使是未知 json 数据结构,我们也可以反序列化,同时可以确保类型安全。在switch-type中,我们可以通过json与Go数据类型对照表来做选择。比如Age是float64而不是int类型,另外json的booleans、null类型在json也常常出现,在这里都做了case。
(三)json数据编码和解码:
json 包提供 Decoder 和 Encoder 类型来支持常用 json 数据流读写。NewDecoder 和 NewEncoder 函数分别封装了 io.Reader 和 io.Writer 接口。
func NewDecoder(r io.Reader) *Decoder
func NewEncoder(w io.Writer) *Encoder
如果要想把 json 直接写入文件,可以使用 json.NewEncoder 初始化文件(或者任何实现 io.Writer 的类型),并调用 Encode();反过来与其对应的是使用 json.Decoder 和 Decode() 函数:
func NewDecoder(r io.Reader) *Decoder
func (dec *Decoder) Decode(v interface{}) error
由于 Go 语言中很多标准包都实现了 Reader 和 Writer接口,因此 Encoder 和 Decoder 使用起来非常方便。
例如,下面例子使用 Decode方法解码一段json格式数据,同时使用Encode方法将我们的结构体数据保存到文件t.json中:
package main
import (
"encoding/json"
"fmt"
"os"
"strings"
)
type Human struct {
Name string `json:"name"` // 姓名
Gender string `json:"s"` // 性别,性别的tag表明在json中为s字段
Age int `json:"Age"` // 年龄
Lesson
}
type Lesson struct {
Lessons []string `json:"lessons"`
}
func main() {
// json数据的字符串
jsonStr := `{"Age": 18,"name": "Jim" ,"s": "男","lessons":["English","History"],"Room":201,"n":null,"b":false}`
strR := strings.NewReader(jsonStr)
h := &Human{}
// Decode 解码json数据到结构体Human中
err := json.NewDecoder(strR).Decode(h)
if err != nil {
fmt.Println(err)
}
fmt.Println(h)
// 定义Encode需要的Writer
f, err := os.Create("./t.json")
defer f.Close()
// 把保存数据的Human结构体对象编码为json保存到文件
json.NewEncoder(f).Encode(h) //&{Jim 男 18 {[English History]}}
}
我们调用json.NewDecoder 函数构造了 Decoder 对象,使用这个对象的 Decode方法解码给定义好的结构体对象h。对于字符串,使用 strings.NewReader 方法,让字符串变成一个 Reader。
类似解码过程,我们通过json.NewEncoder()函数来构造Encoder对象,由于os中文件操作已经实现了Writer接口,所以可以直接使用,把h结构体对象编码为json数据格式保存在文件t.json中。
文件t.json中内容为:{"name":"Jim","s":"男","Age":18,"lessons":["English","History"]}
(四)json数据延迟解析
Human.Name字段,由于可以等到使用的时候,再根据具体数据类型来解析,因此我们可以延迟解析。当结构体Human的Name字段的类型设置为 json.RawMessage 时,它将在解码后继续以 byte 数组方式存在。
package main
import (
"encoding/json"
"fmt"
)
type Human struct {
Name json.RawMessage `json:"name"` // 姓名,json.RawMessage 类型不会进行解码
Gender string `json:"s"` // 性别,性别的tag表明在json中为s字段
Age int `json:"Age"` // 年龄
Lesson
}
type Lesson struct {
Lessons []string `json:"lessons"`
}
func main() {
jsonStr := `{"Age": 18,"name": "Jim" ,"s": "男","lessons":["English","History"],"Room":201,"n":null,"b":false}`
var hu Human
if err := json.Unmarshal([]byte(jsonStr), &hu); err == nil {
fmt.Printf("结构体Human \n")
fmt.Printf("%+v \n", hu) // 可以看到Name字段未解码,还是字节数组
fmt.Printf("%+v \n", string(hu.Name)) // 可以看到Name字段未解码,还是字节数组
}
// 对延迟解码的Human.Name进行反序列化
var UName string
if err := json.Unmarshal(hu.Name, &UName); err == nil {
fmt.Printf("\n Human.Name: %s \n", UName)
}
}
程序输出:
package main
import (
"encoding/json"
"fmt"
)
type Human struct {
Name json.RawMessage `json:"name"` // 姓名,json.RawMessage 类型不会进行解码
Gender string `json:"s"` // 性别,性别的tag表明在json中为s字段
Age int `json:"Age"` // 年龄
Lesson
}
type Lesson struct {
Lessons []string `json:"lessons"`
}
func main() {
jsonStr := `{"Age": 18,"name": "Jim" ,"s": "男","lessons":["English","History"],"Room":201,"n":null,"b":false}`
var hu Human
if err := json.Unmarshal([]byte(jsonStr), &hu); err == nil {
fmt.Printf("结构体Human \n")//结构体Human
//{Name:[34 74 105 109 34] Gender:男 Age:18 Lesson:{Lessons:[English History]}}
fmt.Printf("%+v \n", hu)
fmt.Printf("%+v \n", string(hu.Name)) // "Jim"
}
// 对延迟解码的Human.Name进行反序列化
var UName string
if err := json.Unmarshal(hu.Name, &UName); err == nil {
fmt.Printf("Human.Name: %s \n", UName)//Human.Name: Jim
}
}
在对json数据第一次解码后,保存在Human的hu.Name的值还是二进制数组,在后面对hu.Name进行解码后才真正发序列化为string类型的真实字符串对象。
除了Go标准库外,还有很多的第三方库也能较好解析json数据。这里我推荐一个github的第三方库
如同 encoding/json 包一样,在Go语言中XML也有 Marshal() 和 UnMarshal() 从 XML 中编码和解码数据;也可以从文件中读取和写入(或者任何实现了 io.Reader 和 io.Writer 接口的类型)。和 json 的方式一样,XML 数据可以序列化为结构,或者从结构反序列化为 XML 数据。
36.MySql数据库
database/sql包
Go 提供了database/sql包用于对关系型数据库的访问,作为操作数据库的入口对象sql.DB,主要为我们提供了两个重要的功能:
sql.DB 通过数据库驱动为我们提供管理底层数据库连接的打开和关闭操作.
sql.DB 为我们管理数据库连接池
需要注意的是,sql.DB表示操作数据库的抽象访问接口, 而非一个数据库连接对象;它可以根据driver打开关闭数据库连接,管理连接池。正在使用的连接被标记为繁忙,用完后回到连接池等待下次使用。所以,如果你没有把连接释放回连接池,会导致过多连接使系统资源耗尽。
具体到某一类型的关系型数据库,需要导入对应的数据库驱动。面以MySql8.0为例,来讲讲怎么在Go语言中调用。
首先,需要下载第三方包:
go get github.com/go-sql-driver/mysql
在代码中导入mysql数据库驱动:
import (
"database/sql"
_ "github.com/go-sql-driver/mysql"
)
通常来说,不应该直接使用驱动所提供的方法,而是应该使用 sql.DB,因此在导入 mysql 驱动时,这里使用了匿名导入的方式(在包路径前添加 _),当导入了一个数据库驱动后,此驱动会自行初始化并注册自己到Go的database/sql上下文中,因此我们就可以通过 database/sql 包提供的方法访问数据库了。
Mysql数据库操作
由于预编译语句(PreparedStatement)提供了诸多好处,可以实现自定义参数的查询,通常来说,比手动拼接字符串 SQL 语句高效,可以防止SQL注入攻击。
下面代码使用预编译的方式,来进行增删改查的操作,并通过事务来批量提交一批数据。
在Go语言中对数据类型要求很严格,一般查询数据时先定义数据类型,但是查询数据库中的数据存在三种可能: 存在值,存在零值,未赋值NULL 三种状态,因此可以将待查询的数据类型定义为sql.Nullxxx类型,可以通过判断Valid值来判断查询到的值是否为赋值状态还是未赋值NULL状态。
package main
import (
"database/sql"
"fmt"
"strings"
"time"
_ "github.com/go-sql-driver/mysql"
)
type DbWorker struct {
Dsn string
Db *sql.DB
}
type Cate struct {
cid int
cname string
addtime int
scope int
}
func main() {
dbw := DbWorker{Dsn: "root:123456@tcp(127.0.0.1:3306)/test?charset=utf8mb4"}
// 支持下面几种DSN写法,具体看mysql服务端配置,常见为第2种
// user@unix(/path/to/socket)/dbname?charset=utf8
// user:password@tcp(localhost:5555)/dbname?charset=utf8
// user:password@/dbname
// user:password@tcp([de:ad:be:ef::ca:fe]:80)/dbname
dbtemp, err := sql.Open("mysql", dbw.Dsn)
dbw.Db = dbtemp
if err != nil {
panic(err)
return
}
defer dbw.Db.Close()
// 插入数据测试
dbw.insertData()
// 删除数据测试
dbw.deleteData()
// 修改数据测试
dbw.editData()
// 查询数据测试
dbw.queryData()
// 事务操作测试
dbw.transaction()
}
// 插入数据,sql预编译
func (dbw *DbWorker) insertData() {
stmt, _ := dbw.Db.Prepare(`INSERT INTO t_article_cate (cname, addtime, scope) VALUES (?, ?, ?)`)
defer stmt.Close()
ret, err := stmt.Exec("栏目6", time.Now().Unix(), 10)
// 通过返回的ret可以进一步查询本次插入数据影响的行数
// RowsAffected和最后插入的Id(如果数据库支持查询最后插入Id)
if err != nil {
fmt.Printf("insert data error: %v\n", err)
return
}
if LastInsertId, err := ret.LastInsertId(); nil == err {
fmt.Println("LastInsertId:", LastInsertId)
}
if RowsAffected, err := ret.RowsAffected(); nil == err {
fmt.Println("RowsAffected:", RowsAffected)
}
}
// 删除数据,预编译
func (dbw *DbWorker) deleteData() {
stmt, err := dbw.Db.Prepare(`DELETE FROM t_article_cate WHERE cid=?`)
ret, err := stmt.Exec(122)
// 通过返回的ret可以进一步查询本次插入数据影响的行数RowsAffected和
// 最后插入的Id(如果数据库支持查询最后插入Id).
if err != nil {
fmt.Printf("insert data error: %v\n", err)
return
}
if RowsAffected, err := ret.RowsAffected(); nil == err {
fmt.Println("RowsAffected:", RowsAffected)
}
}
// 修改数据,预编译
func (dbw *DbWorker) editData() {
stmt, err := dbw.Db.Prepare(`UPDATE t_article_cate SET scope=? WHERE cid=?`)
ret, err := stmt.Exec(111, 123)
// 通过返回的ret可以进一步查询本次插入数据影响的行数RowsAffected和
// 最后插入的Id(如果数据库支持查询最后插入Id).
if err != nil {
fmt.Printf("insert data error: %v\n", err)
return
}
if RowsAffected, err := ret.RowsAffected(); nil == err {
fmt.Println("RowsAffected:", RowsAffected)
}
}
// 查询数据,预编译
func (dbw *DbWorker) queryData() {
// 如果方法包含Query,那么这个方法是用于查询并返回rows的。其他用Exec()
// 另外一种写法
// rows, err := db.Query("select id, name from users where id = ?", 1)
stmt, _ := dbw.Db.Prepare(`SELECT cid, cname, addtime, scope From t_article_cate where status=?`)
//err = db.QueryRow("select name from users where id = ?", 1).Scan(&name) // 单行查询,直接处理
defer stmt.Close()
rows, err := stmt.Query(0)
defer rows.Close()
if err != nil {
fmt.Printf("insert data error: %v\n", err)
return
}
// 构造scanArgs、values两个slice,
// scanArgs的每个值指向values相应值的地址
columns, _ := rows.Columns()
fmt.Println(columns)
rowMaps := make([]map[string]string, 9)
values := make([]sql.RawBytes, len(columns))
scans := make([]interface{}, len(columns))
for i := range values {
scans[i] = &values[i]
scans[i] = &values[i]
}
i := 0
for rows.Next() {
//将行数据保存到record字典
err = rows.Scan(scans...)
each := make(map[string]string, 4)
// 由于是map引用,放在上层for时,rowMaps最终返回值是最后一条。
for i, col := range values {
each[columns[i]] = string(col)
}
// 切片追加数据,索引位置有意思。不这样写就不是希望的样子。
rowMaps = append(rowMaps[:i], each)
fmt.Println(each)
i++
}
fmt.Println(rowMaps)
for i, col := range rowMaps {
fmt.Println(i, col)
}
err = rows.Err()
if err != nil {
fmt.Printf(err.Error())
}
}
func (dbw *DbWorker) transaction() {
tx, err := dbw.Db.Begin()
if err != nil {
fmt.Printf("insert data error: %v\n", err)
return
}
defer tx.Rollback()
stmt, err := tx.Prepare(`INSERT INTO t_article_cate (cname, addtime, scope) VALUES (?, ?, ?)`)
if err != nil {
fmt.Printf("insert data error: %v\n", err)
return
}
for i := 100; i < 110; i++ {
cname := strings.Join([]string{"栏目-", string(i)}, "-")
_, err = stmt.Exec(cname, time.Now().Unix(), i+20)
if err != nil {
fmt.Printf("insert data error: %v\n", err)
return
}
}
err = tx.Commit()
if err != nil {
fmt.Printf("insert data error: %v\n", err)
return
}
stmt.Close()
}
每次db.Query操作后,都建议调用rows.Close()。 因为 db.Query() 会从数据库连接池中获取一个连接,这个底层连接在结果集(rows)未关闭前会被标记为处于繁忙状态。当遍历读到最后一条记录时,会发生一个内部EOF错误,自动调用rows.Close(), 但如果提前退出循环,rows不会关闭,连接不会回到连接池中,连接也不会关闭,则此连接会一直被占用。 因此通常我们使用 defer rows.Close() 来确保数据库连接可以正确放回到连接池中。
事务处理: db.Begin()开始事务,Commit() 或 Rollback()关闭事务。Tx从连接池中取出一个连接,在关闭之前都使用这个连接。Tx不能和DB层的BEGIN,COMMIT混合使用。