Go语言基础四

35.数据序列化

序列化与反序列化

我们的数据对象要在网络中传输或保存到文件,就需要对其编码和解码动作,目前存在很多编码格式:json,XML,Gob,Google Protocol Buffer等,Go 语言当然也支持所有这些编码格式。

序列化 (Serialization)是将对象的状态信息转换为可以存储或传输的形式的过程。在序列化期间,对象将其当前状态写入到临时或持久性存储区。通过从存储区中读取对象的状态,重新创建该对象,则为反序列化。

简单地说把某种数据结构转为指定数据格式为“序列化”或“编码”(传输之前);而把“指定数据格式”转为某种数据结构则为“反序列化”或“解码”(传输之后)。

在Go语言中,encoding/json标准包处理json数据的序列化与反序列化问题。

json数据序列化函数主要有:json.Marshal()

func Marshal(v interface{}) ([]byte, error) {
    e := newEncodeState()

    err := e.marshal(v, encOpts{escapeHTML: true})
    if err != nil {
        return nil, err
    }
    buf := append([]byte(nil), e.Bytes()...)

    e.Reset()
    encodeStatePool.Put(e)

    return buf, nil
}

从上面的Marshal()函数我们可以看到,数据结构序列化后返回的是字节数组,而字节数组很容易通过网络传输或写入文件存储。而且在Go中,Marshal()默认是设置escapeHTML = true的,会自动把 ‘<’, ‘>’, 以及 ‘&’ 等转化为"\u003c" , "\u003e"以及 “\u0026”。
json数据反序列化函数主要有:UnMarshal()

func Unmarshal(data []byte, v interface{}) error // 把 json 解码为数据结构

从上面的UnMarshal()函数我们可以看到,反序列化是读取字节数组,进而解析为对应的数据结构。

注意:不是所有的数据都可以编码为 json 格式,只有验证通过的数据结构才能被编码:

json 对象只支持字符串类型的 key;要编码一个 Go map 类型,map 必须是 map[string]T(T是 json包中支持的任何类型)
channel,复杂类型和函数类型不能被编码
不支持循环数据结构; 它将引起序列化进入一个无限循环
指针可以被编码,实际上是对指针指向的值进行编码(或者指针是 nil)

而在Go中,json 与 Go 类型对应如下:

bool 对应 json 的 booleans
float64 对应 json 的 numbers
string 对应 json 的strings
nil 对应 json 的 null

在解析 json 格式数据时,若以 interface{} 接收数据,需要按照以上规则进行解析。

json数据格式

在Go语言中,利用encoding/json标准包将数据序列化为json数据格式这个过程简单直接,直接使用json.Marshal(v)来处理任意类型,序列化成功后得到一个字节数组。

反过来我们将一个json数据来反序列化或解码,则就不那么容易了,下面我们一一来说明。

(一)将json数据反序列化到结构体:

这种需求是最常见的,在我们知道 json 的数据结构前提情况下,我们完全可以定义一个或几个适当的结构体并对 json 数据反序列化。例如:

package main

import (
	"encoding/json"
	"fmt"
)

type Human struct {
	name   string `json:"name"` // 姓名
	Gender string `json:"s"`    // 性别,性别的tag表明在json中为s字段
	Age    int    `json:"Age"`  // 年龄
	Lesson
}

type Lesson struct {
	Lessons []string `json:"lessons"`
}

func main() {
	//name 不会被解析出来,因为name是小写字段不会被解析出来 要解析的话将结构体name改为Name
	jsonStr := `{"Age": 18,"name": "Jim" ,"s": "男",
	"lessons":["English","History"],"Room":201,"n":null,"b":false}`

	var hu Human
	if err := json.Unmarshal([]byte(jsonStr), &hu); err == nil {
		fmt.Println("\n结构体Human")
		fmt.Println(hu)
	}

	var le Lesson
	if err := json.Unmarshal([]byte(jsonStr), &le); err == nil {
		fmt.Println("\n结构体Lesson")
		fmt.Println(le)
	}

	jsonStr = `["English","History"]`

	var str []string
	if err := json.Unmarshal([]byte(jsonStr), &str); err == nil {
		fmt.Println("\n字符串数组")
		fmt.Println(str)
	} else {
		fmt.Println(err)
	}
}

输出:

结构体Human
{18 {[English History]}}

结构体Lesson
{[English History]}

字符串数组
[English History]

我们定义了2个结构体Human和Lesson,结构体Human的Gender字段tag标签为:json:“s”,表明这个字段在json中的名字对应为s。而且结构体Human中嵌入了Lesson结构体。

jsonStr 我们可以认作为一个json数据,通过json.Unmarshal,我们可以把json中的数据反序列化到了对应结构体,由于结构体Human的name字段不能导出,所以并不能实际得到json中的值,这是我们在定义结构体时需要注意的,字段首字母大写。

对json中的Age,在结构体Human对应Age int,不能是string。另外,如果是json数组,可以把数据反序列化给一个字符串数组。

总之,知道json的数据结构很关键,有了这个前提做反序列化就容易多了。而且结构体的字段并不需要和json中所有数据都一一对应,定义的结构体字段可以是json中的一部分。

(二)反序列化任意json数据:

encoding/json 包使用 map[string]interface{} 和 []interface{} 储存任意的 json 对象和数组;其可以被反序列化为任何的 json blob 存储到接口值中。

直接使用 Unmarshal 把这个数据反序列化,并保存在map[string]interface{} 中,要访问这个数据,我们可以使用类型断言:

package main

import (
	"encoding/json"
	"fmt"
)

func main() {
	jsonStr := `{"Age": 18,"name": "Jim" ,"s": "男","Lessons":["English","History"],"Room":201,"n":null,"b":false}`

	var data map[string]interface{}
	if err := json.Unmarshal([]byte(jsonStr), &data); err == nil {
		fmt.Println("map结构")
		fmt.Println(data)
	}

	for k, v := range data {
		switch vv := v.(type) {
		case string:
			fmt.Println(k, "是string", vv)
		case bool:
			fmt.Println(k, "是bool", vv)
		case float64:
			fmt.Println(k, "是float64", vv)
		case nil:
			fmt.Println(k, "是nil", vv)
		case []interface{}:
			fmt.Println(k, "是array:")
			for i, u := range vv {
				fmt.Println(i, u)
			}
		default:
			fmt.Println(k, "未知数据类型")
		}
	}
}

程序输出:

map结构
map[Age:18 Lessons:[English History] Room:201 b:false n:<nil> name:Jim s:]
b 是bool false
Age 是float64 18
name 是string Jim
s 是string 男
Lessons 是array:
0 English
1 History
Room 是float64 201
n 是nil <nil>

通过这种方式,即使是未知 json 数据结构,我们也可以反序列化,同时可以确保类型安全。在switch-type中,我们可以通过json与Go数据类型对照表来做选择。比如Age是float64而不是int类型,另外json的booleans、null类型在json也常常出现,在这里都做了case。

(三)json数据编码和解码:

json 包提供 Decoder 和 Encoder 类型来支持常用 json 数据流读写。NewDecoder 和 NewEncoder 函数分别封装了 io.Reader 和 io.Writer 接口。

func NewDecoder(r io.Reader) *Decoder
func NewEncoder(w io.Writer) *Encoder

如果要想把 json 直接写入文件,可以使用 json.NewEncoder 初始化文件(或者任何实现 io.Writer 的类型),并调用 Encode();反过来与其对应的是使用 json.Decoder 和 Decode() 函数:

func NewDecoder(r io.Reader) *Decoder
func (dec *Decoder) Decode(v interface{}) error

由于 Go 语言中很多标准包都实现了 Reader 和 Writer接口,因此 Encoder 和 Decoder 使用起来非常方便。

例如,下面例子使用 Decode方法解码一段json格式数据,同时使用Encode方法将我们的结构体数据保存到文件t.json中:

package main

import (
	"encoding/json"
	"fmt"
	"os"
	"strings"
)

type Human struct {
	Name   string `json:"name"` // 姓名
	Gender string `json:"s"`    // 性别,性别的tag表明在json中为s字段
	Age    int    `json:"Age"`  // 年龄
	Lesson
}

type Lesson struct {
	Lessons []string `json:"lessons"`
}

func main() {
	// json数据的字符串
	jsonStr := `{"Age": 18,"name": "Jim" ,"s": "男","lessons":["English","History"],"Room":201,"n":null,"b":false}`
	strR := strings.NewReader(jsonStr)
	h := &Human{}

	// Decode 解码json数据到结构体Human中
	err := json.NewDecoder(strR).Decode(h)
	if err != nil {
		fmt.Println(err)
	}
	fmt.Println(h)

	// 定义Encode需要的Writer
	f, err := os.Create("./t.json")
	defer f.Close()

	// 把保存数据的Human结构体对象编码为json保存到文件
	json.NewEncoder(f).Encode(h) //&{Jim 男 18 {[English History]}}
}

我们调用json.NewDecoder 函数构造了 Decoder 对象,使用这个对象的 Decode方法解码给定义好的结构体对象h。对于字符串,使用 strings.NewReader 方法,让字符串变成一个 Reader。

类似解码过程,我们通过json.NewEncoder()函数来构造Encoder对象,由于os中文件操作已经实现了Writer接口,所以可以直接使用,把h结构体对象编码为json数据格式保存在文件t.json中。

文件t.json中内容为:{"name":"Jim","s":"男","Age":18,"lessons":["English","History"]}
(四)json数据延迟解析

Human.Name字段,由于可以等到使用的时候,再根据具体数据类型来解析,因此我们可以延迟解析。当结构体Human的Name字段的类型设置为 json.RawMessage 时,它将在解码后继续以 byte 数组方式存在。

package main

import (
	"encoding/json"
	"fmt"
)

type Human struct {
	Name   json.RawMessage `json:"name"` // 姓名,json.RawMessage 类型不会进行解码
	Gender string          `json:"s"`    // 性别,性别的tag表明在json中为s字段
	Age    int             `json:"Age"`  // 年龄
	Lesson
}

type Lesson struct {
	Lessons []string `json:"lessons"`
}

func main() {
	jsonStr := `{"Age": 18,"name": "Jim" ,"s": "男","lessons":["English","History"],"Room":201,"n":null,"b":false}`

	var hu Human
	if err := json.Unmarshal([]byte(jsonStr), &hu); err == nil {
		fmt.Printf("结构体Human \n")
		fmt.Printf("%+v \n", hu)              // 可以看到Name字段未解码,还是字节数组
		fmt.Printf("%+v \n", string(hu.Name)) // 可以看到Name字段未解码,还是字节数组
	}

	// 对延迟解码的Human.Name进行反序列化
	var UName string
	if err := json.Unmarshal(hu.Name, &UName); err == nil {
		fmt.Printf("\n Human.Name: %s \n", UName)
	}
}

程序输出:

package main

import (
	"encoding/json"
	"fmt"
)

type Human struct {
	Name   json.RawMessage `json:"name"` // 姓名,json.RawMessage 类型不会进行解码
	Gender string          `json:"s"`    // 性别,性别的tag表明在json中为s字段
	Age    int             `json:"Age"`  // 年龄
	Lesson
}

type Lesson struct {
	Lessons []string `json:"lessons"`
}

func main() {
	jsonStr := `{"Age": 18,"name": "Jim" ,"s": "男","lessons":["English","History"],"Room":201,"n":null,"b":false}`
	var hu Human
	if err := json.Unmarshal([]byte(jsonStr), &hu); err == nil {
		fmt.Printf("结构体Human \n")//结构体Human 
		//{Name:[34 74 105 109 34] Gender:男 Age:18 Lesson:{Lessons:[English History]}} 
		fmt.Printf("%+v \n", hu)
		fmt.Printf("%+v \n", string(hu.Name)) // "Jim" 
	}

	// 对延迟解码的Human.Name进行反序列化
	var UName string
	if err := json.Unmarshal(hu.Name, &UName); err == nil {
		fmt.Printf("Human.Name: %s \n", UName)//Human.Name: Jim 
	}
}

在对json数据第一次解码后,保存在Human的hu.Name的值还是二进制数组,在后面对hu.Name进行解码后才真正发序列化为string类型的真实字符串对象。

除了Go标准库外,还有很多的第三方库也能较好解析json数据。这里我推荐一个github的第三方库

如同 encoding/json 包一样,在Go语言中XML也有 Marshal() 和 UnMarshal() 从 XML 中编码和解码数据;也可以从文件中读取和写入(或者任何实现了 io.Reader 和 io.Writer 接口的类型)。和 json 的方式一样,XML 数据可以序列化为结构,或者从结构反序列化为 XML 数据。

36.MySql数据库

database/sql包

Go 提供了database/sql包用于对关系型数据库的访问,作为操作数据库的入口对象sql.DB,主要为我们提供了两个重要的功能:

sql.DB 通过数据库驱动为我们提供管理底层数据库连接的打开和关闭操作.
sql.DB 为我们管理数据库连接池
需要注意的是,sql.DB表示操作数据库的抽象访问接口, 而非一个数据库连接对象;它可以根据driver打开关闭数据库连接,管理连接池。正在使用的连接被标记为繁忙,用完后回到连接池等待下次使用。所以,如果你没有把连接释放回连接池,会导致过多连接使系统资源耗尽。

具体到某一类型的关系型数据库,需要导入对应的数据库驱动。面以MySql8.0为例,来讲讲怎么在Go语言中调用。

首先,需要下载第三方包:

go get github.com/go-sql-driver/mysql

在代码中导入mysql数据库驱动:

import (
   "database/sql"
   _ "github.com/go-sql-driver/mysql"
)

通常来说,不应该直接使用驱动所提供的方法,而是应该使用 sql.DB,因此在导入 mysql 驱动时,这里使用了匿名导入的方式(在包路径前添加 _),当导入了一个数据库驱动后,此驱动会自行初始化并注册自己到Go的database/sql上下文中,因此我们就可以通过 database/sql 包提供的方法访问数据库了。

Mysql数据库操作

由于预编译语句(PreparedStatement)提供了诸多好处,可以实现自定义参数的查询,通常来说,比手动拼接字符串 SQL 语句高效,可以防止SQL注入攻击。

下面代码使用预编译的方式,来进行增删改查的操作,并通过事务来批量提交一批数据。

在Go语言中对数据类型要求很严格,一般查询数据时先定义数据类型,但是查询数据库中的数据存在三种可能: 存在值,存在零值,未赋值NULL 三种状态,因此可以将待查询的数据类型定义为sql.Nullxxx类型,可以通过判断Valid值来判断查询到的值是否为赋值状态还是未赋值NULL状态。

package main

import (
	"database/sql"
	"fmt"
	"strings"
	"time"

	_ "github.com/go-sql-driver/mysql"
)

type DbWorker struct {
	Dsn string
	Db  *sql.DB
}

type Cate struct {
	cid     int
	cname   string
	addtime int
	scope   int
}

func main() {
	dbw := DbWorker{Dsn: "root:123456@tcp(127.0.0.1:3306)/test?charset=utf8mb4"}
	// 支持下面几种DSN写法,具体看mysql服务端配置,常见为第2种
	// user@unix(/path/to/socket)/dbname?charset=utf8
	// user:password@tcp(localhost:5555)/dbname?charset=utf8
	// user:password@/dbname
	// user:password@tcp([de:ad:be:ef::ca:fe]:80)/dbname

	dbtemp, err := sql.Open("mysql", dbw.Dsn)
	dbw.Db = dbtemp

	if err != nil {
		panic(err)
		return
	}
	defer dbw.Db.Close()

	// 插入数据测试
	dbw.insertData()

	// 删除数据测试
	dbw.deleteData()
	
	// 修改数据测试
	dbw.editData()
	
	// 查询数据测试
	dbw.queryData()
	
	// 事务操作测试
	dbw.transaction()
}

// 插入数据,sql预编译
func (dbw *DbWorker) insertData() {
	stmt, _ := dbw.Db.Prepare(`INSERT INTO t_article_cate (cname, addtime, scope) VALUES (?, ?, ?)`)
	defer stmt.Close()

	ret, err := stmt.Exec("栏目6", time.Now().Unix(), 10)

	// 通过返回的ret可以进一步查询本次插入数据影响的行数
	// RowsAffected和最后插入的Id(如果数据库支持查询最后插入Id)
	if err != nil {
		fmt.Printf("insert data error: %v\n", err)
		return
	}
	if LastInsertId, err := ret.LastInsertId(); nil == err {
		fmt.Println("LastInsertId:", LastInsertId)
	}
	if RowsAffected, err := ret.RowsAffected(); nil == err {
		fmt.Println("RowsAffected:", RowsAffected)
	}
}

// 删除数据,预编译
func (dbw *DbWorker) deleteData() {
	stmt, err := dbw.Db.Prepare(`DELETE FROM t_article_cate WHERE cid=?`)
	ret, err := stmt.Exec(122)
	// 通过返回的ret可以进一步查询本次插入数据影响的行数RowsAffected和
	// 最后插入的Id(如果数据库支持查询最后插入Id).
	if err != nil {
		fmt.Printf("insert data error: %v\n", err)
		return
	}
	if RowsAffected, err := ret.RowsAffected(); nil == err {
		fmt.Println("RowsAffected:", RowsAffected)
	}
}

// 修改数据,预编译
func (dbw *DbWorker) editData() {
	stmt, err := dbw.Db.Prepare(`UPDATE t_article_cate SET scope=? WHERE cid=?`)
	ret, err := stmt.Exec(111, 123)
	// 通过返回的ret可以进一步查询本次插入数据影响的行数RowsAffected和
	// 最后插入的Id(如果数据库支持查询最后插入Id).
	if err != nil {
		fmt.Printf("insert data error: %v\n", err)
		return
	}
	if RowsAffected, err := ret.RowsAffected(); nil == err {
		fmt.Println("RowsAffected:", RowsAffected)
	}
}

// 查询数据,预编译
func (dbw *DbWorker) queryData() {
	// 如果方法包含Query,那么这个方法是用于查询并返回rows的。其他用Exec()
	// 另外一种写法
	// rows, err := db.Query("select id, name from users where id = ?", 1)
	stmt, _ := dbw.Db.Prepare(`SELECT cid, cname, addtime, scope From t_article_cate where status=?`)
	//err = db.QueryRow("select name from users where id = ?", 1).Scan(&name) // 单行查询,直接处理
	defer stmt.Close()

	rows, err := stmt.Query(0)
	defer rows.Close()
	if err != nil {
		fmt.Printf("insert data error: %v\n", err)
		return
	}

	// 构造scanArgs、values两个slice,
	// scanArgs的每个值指向values相应值的地址
	columns, _ := rows.Columns()
	fmt.Println(columns)
	rowMaps := make([]map[string]string, 9)
	values := make([]sql.RawBytes, len(columns))
	scans := make([]interface{}, len(columns))
	for i := range values {
		scans[i] = &values[i]
		scans[i] = &values[i]
	}
	i := 0
	for rows.Next() {
		//将行数据保存到record字典
		err = rows.Scan(scans...)

		each := make(map[string]string, 4)
		// 由于是map引用,放在上层for时,rowMaps最终返回值是最后一条。
		for i, col := range values {
			each[columns[i]] = string(col)
		}

		// 切片追加数据,索引位置有意思。不这样写就不是希望的样子。
		rowMaps = append(rowMaps[:i], each)
		fmt.Println(each)
		i++
	}
	fmt.Println(rowMaps)

	for i, col := range rowMaps {
		fmt.Println(i, col)
	}

	err = rows.Err()
	if err != nil {
		fmt.Printf(err.Error())
	}
}

func (dbw *DbWorker) transaction() {
	tx, err := dbw.Db.Begin()
	if err != nil {

		fmt.Printf("insert data error: %v\n", err)
		return
	}
	defer tx.Rollback()
	stmt, err := tx.Prepare(`INSERT INTO t_article_cate (cname, addtime, scope) VALUES (?, ?, ?)`)
	if err != nil {

		fmt.Printf("insert data error: %v\n", err)
		return
	}

	for i := 100; i < 110; i++ {
		cname := strings.Join([]string{"栏目-", string(i)}, "-")
		_, err = stmt.Exec(cname, time.Now().Unix(), i+20)
		if err != nil {
			fmt.Printf("insert data error: %v\n", err)
			return
		}
	}
	err = tx.Commit()
	if err != nil {
		fmt.Printf("insert data error: %v\n", err)
		return
	}
	stmt.Close()
}

每次db.Query操作后,都建议调用rows.Close()。 因为 db.Query() 会从数据库连接池中获取一个连接,这个底层连接在结果集(rows)未关闭前会被标记为处于繁忙状态。当遍历读到最后一条记录时,会发生一个内部EOF错误,自动调用rows.Close(), 但如果提前退出循环,rows不会关闭,连接不会回到连接池中,连接也不会关闭,则此连接会一直被占用。 因此通常我们使用 defer rows.Close() 来确保数据库连接可以正确放回到连接池中。

事务处理: db.Begin()开始事务,Commit() 或 Rollback()关闭事务。Tx从连接池中取出一个连接,在关闭之前都使用这个连接。Tx不能和DB层的BEGIN,COMMIT混合使用。

  • 27
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值