前言
Go语言的数据类型分为四类:基础类型
、复合类型
、引用类型
和接口类型
。其中
- 基础类型,包括:
int
,uint
、float
,string
,bool
等 - 复合类型,包括:
结构体
、数组
。它们由一个或者多个元素组成更加复杂的数据结构 - 引用类型,包括:
指针
、slice
、map
、chan
、func
- 接口类型
字符串
Go语言源文件都是用UTF-8编码。 一个字符串是一个不可改变的字节序列,类似C++中的字面字符串,只能读不能写。
这里要注意的是len(string)的长度是指存放在内存中的字节数目(而不是rune字符数目)。所以索引操作s[i]表示内存中第i个字节值。
第i
字节并不一定是第i
个字符,因为对于非ASCII字符的UTF-8编码会要多两个或者多个字节。
科普一下ASCII、Unicode和UTF-8之间的关系:
- ASCII是当时美国为了把英语字符和二进制做映射,一个字节一个字符,一个字节有8位=2^8=256个字符表示,这对英文字符完全够用。当时如果引入了汉字等其他字符,这ASCII表肯定是不够用的
- Unicode就延伸出来了,它兼容了ASCII表,就是前0-255个数字是完全对应ASCII表的,从256数字开始就映射的其他字符,包括中文字符等。那么Unicode编码的目的就是要把全世界所有国家的字符全部纳入到其中。
但是这里存在一个问题:可能把全世界的字符全部存储进来,可能字节大小有4~8个字节那么多,则ASCII的第一个字符只占用了一个字节,则剩下的3-7个字节都存储的0值,严重浪费空间
,所以需要引入新的编码方式,尽量节约内存空间。 - UTF-8应运而生,Unicode只是一个字符集,UTF-8是Unicode的一种实现方式,目前也是应用最广泛的。UTF-8最大的一个特点:它是一种变长的编码方式。它可以使用1-4个字节表示一个字符。
更多信息,需要自己上网查看。由此,我们可以知道,一个字节并不一定代表一个字符。一个rune表示一个字符。
字符串字面值
如果一个字符串太长,你想要主动换行,可以用反引号代替双引号,它里面的字符没有转义操作,同时可以跨越多行,例如:
// 格式好看的写法,使用反引号
var buffer bytes.Buffer
buffer.WriteString(`
SELECT sale_order_id, amount
FROM sale_order
WHERE company_id=?
AND user_id=?
AND status=?
`)
// 格式不好看的写法,使用双引号
buffer.WriteString("SELECT sale_order_id, amount FROM sale_order WHERE company_id=? AND user_id=? AND status=?")
(*o).Raw(buffer.String(), soId, uId, consts.STATUS_OK).QueryRows(&sos)
上面在打orm的日志时,前者会格式输出,易读美观。后者是一坨,不清晰,看着日志比较吃力。
byte和rune使用
对于中文字符串的输出:
var s:="hello, "世界"
现在要输出s字符的个数和遍历s各个字符,需要借助utf-8标准库,有两种方式实现。
第一种方式:
for i:=0;i<len(s);{
r, size:=utf8.RuneCountInString(s[i:]) // 获取一个字符, 且返回一个字符和字符所占字节数
fmt.Printf("%d\t%c\n", i, r)
i+=size
}
第二种方式:
// 这个range是遍历字符, 隐式解码
for i, r:= range s{
fmt.Printf("%d\t%c\t%d", i, r, r)
}
有关字符串处理的标准库
常用的字符串处理的标准库有四个:bytes
, strings
,strconv
和unicode
, 其中前两个标准库比较相似,一个针对比特流,一个针对字符串。举两个例子简单使用一下标准库: 1. 实现类似linux中的basename命令;2.int型的动态数组字符串输出;
对于第一个,输入:basename a/b/c.go
, 输出:c
func basename(s string) string{
slash:=strings.LastIndex(s, "/")
s = s[slash+1:]
if dot:= strings.LastIndex(s, "."); dot>=0 {
s=s[:dot]
}
return s
}
func intsToString(elems []int) string{
var buffer bytes.Buffer
buffer.WriteString("[")
for index, elem:= range elems{
if index >0 {
buffer.WriteString(", ")
}
fmt.Fprintf(&buffer, "%d", elem)
}
buffer.WriteString("]")
return buffer.String()
}
func main(){
fmt.Println(intsToString([]int{1,2,3}) // "[1, 2, 3]"
}
iota理解和使用
初学者可能对iota的使用不是很了解,常量声明可以使用iota常量进行初始化,但不是每一行都需要写一遍初始化表达式。
明白粗体部分的文字,你就秒懂iota的使用方法。在一个const声明语句中,在第一个声明的常量所在行,iota=0,然后在每一个有常量声明的行加一操作, 两个例子:一个表示一周;一个表示网络的枚举
type Weekday int
const (
Sunday Weekday = iota // iota =0
Monday // iota =1
Tuesday // iota =2
Wednesday
Thursday
Friday // ......
Saturday // iota = 6
)
type Flags uint
const (
FlagUp Flags = 1 << iota // is up
FlagBroadcast // supports broadcast access capability
FlagLoopback // is a loopback interface
FlagPointToPoint // belongs to a point-to-point link
FlagMulticast // supports multicast access capability
)
// 其实上面表示 xx Flags = 1 << iota, 比如第三行,iota=2;则第三行的常量值等于1<<2 =4。
这样的解释和例子,不知道是否明白怎么样使用iota常量生成器了。