Golang之旅(1)-数据类型

最新推荐文章于 2023-11-24 15:10:03 发布

一叶知秋@qqy

最新推荐文章于 2023-11-24 15:10:03 发布

阅读量484

点赞数

分类专栏： GO技术预研文章标签： golang

本文链接：https://blog.csdn.net/qq_41004932/article/details/120590433

版权

GO技术预研专栏收录该内容

22 篇文章 4 订阅

订阅专栏

Golang数据类型

布尔类型
数字类型
字符串类型
指针类型
- 指针类型介绍
- 指针的使用
复杂类型

布尔类型

布尔型的值只可以是true或者false。
在golang中，布尔类型只占一个字节。
适用于逻辑运算，一般用于程序流程控制和条件判断。Go 语言 bool 类型的 true 表示条件为真， false 表示条件为假。并且==和<等比较操作也会产生布尔型的值。

由于Golang是静态编译语言，不是Python这种的动态语言，所以可以认为当你的变量定义后，类型就是固定不变了，不像动态语言那样可以变来变去，所以肯定是相同类型之间才可以进行比较。

当变量的类型是接口(interface)，则他们之间必须都实现了相同的接口。

所谓的变量类型相同，包括常量和非常量之间的比较也是可以的。

数字类型

数字类型包含以下的类型：

uint8: 无符号8位整形(0～255)
uint16: 无符号16位整形(0～65535)
uint32: 无符号32位整形(0～4294967295)
uint64: 无符号64位整形(0～18446744073709551615)
int8: 有符号8位整形(-128～127)
int16: 有符号16位整形(-32768～32767)
int32: 有符号32位整形(-2147483648～2147483647)
int64: 有符号64位整形(-9223372036854775808～9223372036854775807)
float32: IEEE-754 32位浮点型数
float64: IEEE-754 64位浮点型数
complex64: 32位实数和虚数
complex128: 64位实数和虚数
byte: 和uint8等价，另外一种名称
rune: 和int32等价，另外一种名称
uint: 32位或64位的无符号整型，与操作系统有关(32/64)
int: 32位或64位的有符号整型，与操作系统有关(32/64)
uintptr: 无符号整形，用于存放一个指针

Golang的数据类型中支持整形与浮点型数字，而且原生的就支持复数，这是较其他语言的一个优势，其中位的运算采用补码。

在上面的记录的类型中，int、uint是根据操作系统决定的，当操作系统是32位时，int和uint的长度都是32位，当操作系统是64位时，int和uint的长度都是64位。

uintptr是无符号整型，用户存放指针，也是根据操作系统来决定长度的。

字符串类型

字符串是由一串固定长度的字符连接起来的字符序列。Go语言的字符串是由单个字节连接起来的，也就是说对于传统的字符串是由字符组成的，而Go的字符串不同，它是由字节组成的。
Go语言中的字符串的字节使用UTF-8编码来表示Unicode文本。UTF-8是一种被广泛使用的编码格式，是文本文件的标准编码。包括XML和JSON在内都使用该编码。

维基百科：UTF-8（8-bit Unicode Transformation Format）是一种针对Unicode的可变长度字符编码，也是一种前缀码。它可以用一至四个字节对Unicode字符集中的所有有效编码点进行编码，属于Unicode标准的一部分，最初由肯·汤普逊和罗布·派克提出。[2][3]由于较小值的编码点一般使用频率较高，直接使用Unicode编码效率低下，大量浪费内存空间。UTF-8就是为了解决向后兼容ASCII码而设计，Unicode中前128个字符，使用与ASCII码相同的二进制值的单个字节进行编码，而且字面与ASCII码的字面一一对应，这使得原来处理ASCII字符的软件无须或只须做少部分修改，即可继续使用。因此，它逐渐成为电子邮件、网页及其他存储或发送文字优先采用的编码方式。

维基百科：Unicode，联盟官方中文名称为统一码[1]，台湾官方中文名称为万国码[2][3]，也译为国际码、单一码，是计算机科学领域的业界标准。它整理、编码了世界上大部分的文字系统，使得电脑可以用更为简单的方式来呈现和处理文字。
Unicode伴随着通用字符集的标准而发展，同时也以书本的形式[4]对外发表。Unicode至今仍在不断增修，每个新版本都加入更多新的字符。目前最新的版本为2021年9月公布的14.0.0[5]，已经收录超过14万个字符（第十万个字符在2005年获采纳）。Unicode除了视觉上的字形、编码方法、标准的字符编码资料外，还包含了字符特性（如大小写字母）、书写方向、拆分标准等特性的资料库。

由于UTF-8编码占用字节长度的不确定性，所以在Go语言中，字符串也需要占用1～4字节，这与其他编程语言，如C++、Java或者Python不同(Java始终使用2字节)。
Go语言这种解决方案不仅减少了内存和硬盘空间占用，而且也不像其他语言那样需要对使用UTF-8字符集的文本进行编码和解码。

字符串的声明和初始化

str := "hello string"

上面的代码声明了字符串变量str，内容为"hello string"

字符的转义

在Golang中，字符串的创建允许使用双引号(")或者反引号(`)来创建。
当然还有字符串的单引号。

双引号

双引号用来创建可解析的字符串，支持转义，但不能用来引用多行。
双引号中定义的字符串将支持转义字符。比如\n将输出换行。
这与python中的str类型比较相似

反引号

用反引号编码的字符串是原始文本字符串，不接受任何形式的转义。原生的字符串字面量多用于书写多行消息、HTML以及正则表达式。可以表示除了反引号外的所有字符。
这有些类似于python中(r’’)的结构。

单引号

单引号用来定义一个 byte或者rune。
Go语言中byte和rune实质上就是uint8和int32类型。
byte用来强调数据是raw data，而不是数字；
而rune用来表示Unicode的code point。
当我们定义 byte时必须要指定类型，如果不指定类型，默认为 rune。一个单引号只允许一个字符。

字符的连接

Golang的字符是不可改变的，但是字符串支持级联操作(+)和追加操作(+=)。
百度百科：重复性的操作十分烦琐，尤其是在处理多个彼此关联对象情况下，此时我们可以使用级联（Cascade）操作。级联在关联映射中是个重要的概念，指当主动方对象执行操作时，被关联对象（被动方）是否同步执行同一操作。
级联还指用来设计一对多关系。例如一个表存放老师的信息:表A（姓名，性别，年龄），姓名为主键。还有一张表存放老师所教的班级信息:表B（姓名，班级）。他们通过姓名来级联。级联的操作有级联更新，级联删除。在启用一个级联更新选项后，就可在存在相匹配的外键值的前提下更改一个主键值。系统会相应地更新所有匹配的外键值。如果在表A中将姓名为张三的记录改为李四，那么表B中的姓名为张三的所有记录也会随着改为李四。级联删除与更新相类似。如果在表A中将姓名为张三的记录删除，那么表B中的姓名为张三的所有记录也将删除。

字符串的操作符

字符串的内容(纯字节)可以通过标准索引进行获取，例如在方括号[]内写入索引，索引从0开始。
通过下面的示例，可以理解字符串的常用方法：

str := "programming"
fmt.Println(str[1]) //获取字符串索引位置为1的原始字节，比如r为114
fmt.Println(str[1:3]) //截取字符串索引位置为1和2的字符串(不包括最后一个)
fmt.Println(str[1:]) //截取字符串索引位置为1到len(str)-1的字符串
fmt.Println(str[:3]) //截取字符串索引位置为0到2的字符串(不包括3)
fmt.Println(len(str)) //获取字符串的字节数
fmt.Println(utf8.RuneCountInString(str)) //获取字符串的字符个数
fmt.Println([]rune(str)) //将字符串的每一个字节转换为码点值
fmt.Println(string(str[1])) //获取字符串索引位置为1的字符值

以上代码的运行结果如下：

114
ro
rogramming
pro
11
11
[112 114 111 103 114 97 109 109 105 110 103]
r

可以发现当使用索引取出指定单个位置的字符时，取出的是原始字节，也就是码点值。
Unicode码点对应Go语言中的rune整数类型。
倒数第四句和倒数第三句虽然都是11，但是代表的含义不同，上面提到过golang中不像其他语言定宽表示字符，是1～4个字节变宽，所以同样的11个字符，内容改变，可能使用len()得到的字节数超过11，而字符就是字面意思，依然保持为11。

字符串的比较

Golang的字符串支持常规的比较操作(<, >, ==< !=, <=, >=)，在进行比较时，实际上是对内存中的原始数据字节进行逐个比较，因为当两个字符串的内容完全相同时，其内部字节也必是完全相同的，这是编码决定的。

字符串的遍历

通常情况下可以通过索引提取字符，例如：

str := "go web"
fmt.Println(string(str[0])) //获取索引值为0的字符

但是这种方式存在一定的风险，因为并非所有的字符串都是单字节的，如果是多字节的字符使用这种方式显然并不是太理想，因为取出的数据并不完整。

所以在应用时更常使用的是字符串切片，这样返回的就是一个字符，或者可以这么理解，字符串切片返回的单位是字符，可能返回的字节数是一个，也可能是多个，而第一种方法返回的单位是字节，返回的结果可能是一个完整的字符，也可能是一个字符的一部分字节。

str := "i love go web"
chars := []rune(str) //把字符串转为rune切片
for _, char := range chars {
	fmt.Println(string(char))
}

这里的fmt.Println()中的Println是Print和line的组合，所以在打印时会自动换行，不用手动添加。

遍历

如果要将字符串一个一个字符的迭代出来，可以通过for-range循环：

str := "love go web"
for index, char := range str{
	fmt.Printf("%d %U %c \n",index, char, char)
}

累加

直接使用运算符

由于golang的字符串是不可改变的，这是最开始就说了的，所以当简单的使用+=或者+进行累加时，会生成很多的临时无用字符串，当涉及的字符串长度越大时，这一情况越发严重，所以在处理大批量数据的字符串时，这并不是十分建议的。

fmt.Sprintf()

内部使用 []byte 实现，不像直接运算符这种会产生很多临时的字符串，但是内部的逻辑比较复杂，有很多额外的判断，还用到了 interface，所以性能也不是很好

而且最重要的是在一些场景下并不是很实用，这是很容易理解的。

strings.Join()

join会先根据字符串数组的内容，计算出一个拼接之后的长度，然后申请对应大小的内存，一个一个字符串填入，在已有一个数组的情况下，这种效率会很高，但是本来没有，去构造这个数据的代价也不小

a := "hahaha"
b := "hehehe"
c := strings.Join([]string{a,b},",")
println(c)

buffer.WriteString()

这个比较理想，可以当成可变字符使用，对内存的增长也有优化，如果能预估字符串的长度，还可以用 buffer.Grow() 接口来设置 capacity

hello := "hello"
    world := "world"
    for i := 0; i < 1000; i++ {
        var buffer bytes.Buffer
        buffer.WriteString(hello)
        buffer.WriteString(",")
        buffer.WriteString(world)
        _ = buffer.String()
    }

strings.Builder()

不过使用bytes模块来操作string难免让人产生迷惑，所以在go1.10中新增了第三种方法：strings.Builder，官方鼓励尽量在string的拼接时使用Builder，byte拼接时使用Buffer

// strings.Builder的0值可以直接使用
var builder strings.Builder
 
// 向builder中写入字符/字符串
builder.Write([]byte("Hello"))
builder.WriteByte(' ')
builder.WriteString("World")
 
// String() 方法获得拼接的字符串
builder.String() // "Hello World"

从上面的代码中可以看到，strings.Builder和bytes.Buffer的操作几乎一样，不过strings.Builder仅仅实现了write类方法，而Buffer是可读可写的。

所以strings.Builder仅用于拼接/构建字符串

Buffer和Builder性能相差无几，Builder在内存的使用上要略优于Buffer

字符串的修改

在Golang中，字符串类型是不可以修改的，所以不能像其他语言那样通过str[i]这样的方式进行修改，想要修改时只能先复制到可写的[]bute或者[]rune中，然后再进行修改，Golangf中进行修改时会自动复制数据。

修改字节([]byte)

如果是单字节的，可以使用这种方式，但是注意！！！Golang的字符串不是定宽的，是1～4个字节，所以当涉及到多字节的字符时，就会发生问题了。

str := "Hi 世界！ "
by := []byte(str) //转换为[]byte，数据被自动复制
by[2] = ',' //把空格改为半角逗号

修改字符([]rune)

str := "Hi 世界"
by := []rune(str) //转换为[]rune，数据自动复制
by[3] = '中'
by[4] = '国'

指针类型

指针类型介绍

指针类型是指变量存储的是一个内存地址的变量类型/如下的使用示例：

var b int = 66 //定义一个普通类型(int)
var p * int = &b //定义一个指针类型

指针的使用

在fmt.Printf()函数的动词是%p，可以取出地址的指针指，放到格式化字符内。
&可以取出普通变量的内存地址
*可以取出指针存储地址的存储值
Golang的指针与经典的C大体相似，但是不支持直接进行指针的运算(+、-、++、–)，Go 提供了一些底层的库 reflect 和 unsafe，它们可以让使用者把任意一个 Go 指针转成 uintptr 类型的值，然后再像 C++ 一样对指针做算术运算，这里的uintptr是无符号的，长度根据操作系统决定，这是不是跟C的指针是一样的。

复杂类型

数组类型

与其他语言类似，Golang也提供了数组类型的数据结构，数组是具有相同唯一类型的一组已编号且长度固定的数据项的序列，这里强掉的是类型，所以自然可以是整形、字符串、struct或者自定义的类型等等。
数组当然是可以直接通过索引进行访问的。

声明数组

Goalng的数组声明需要制定元素类型和元素个数，语法格式如下：

var name[size] type

name: 数组名
size: 声明数组的元素个数，或者也可以说数组长度
type: 声明数组的类型，例如int

初始化数组

初始化数组的示例如下：

var nums = [5]int32(100, 8, 9, 6, 20)

在经过初始化的数组中，{}中的元素个数不能大于[]中指定的长度，这也是很多编程语言中都遵循的。
如果想不指定长度，可以将[]中使用...占位，这样Golang会根据后面{}中初始化的元素个数，自行设定数组长度。例如：

var nums = [...]int{100, 9, 8, 7, 6}

这里的数组的长度也依然是5.

访问数组元素

在访问数组元素时，可以直接使用索引进行访问

数组的使用

golang中的数组是这样说的: Arrays are values, not implicit pointers as in C.

数组做参数时, 需要被检查长度.
变量名不等于数组开始指针!
不支持C中的*(ar + sizeof(int))方式的指针移动. 需要使用到unsafe包
如果p2array为指向数组的指针， *p2array不等于p2array[0]

数组做参数时, 需要被检查长度

func use_array(args [4]int) {
	args[1] = 100
}

func main() {
	var args = [5]int{1, 2, 3, 4, 5}
	use_array(args)
	fmt.Println(args)
}

编译出错：cannot use args (type [5]int) as type [4]int in argument to use_array

变量名不等于数组开始指针

func use_array(args [5]int) {
	args[1] = 100
}

func main() {
	var args = [5]int{1, 2, 3, 4, 5}
	use_array(args)
	fmt.Println(args)
}

输出结果：[1 2 3 4 5]
因为这里的数组名不再是数组开始的指针，所以这里传入的不再是地址，而是数组的一份拷贝，所以在复制的数组内进行值的改变并不会影响原地址的数组内的值。

// 有长度检查, 也为地址传参
func use_array(args *[4]int) {
	args[1] = 100 //但是使用还是和C一致,不需要别加"*"操作符
}

func main() {
	var args = [4]int{1, 2, 3, 4}
	use_array(&args) // 数组名已经不是表示地址了, 需要使用"&"得到地址
	fmt.Println(args)
}

在Golang中传入数组指针，不仅需要使用&来先对数组取地址，还要确保目标数组的长度也符合定义。
这样就可以避免很多由于程序员的马虎而造成的错误。
输出结果：[1 100 3 4]

结构体类型(struct)

结构体介绍

结构体是由一系列具有相同类型或者不同类型的数据构成的数据的集合。结构体是由0个或者多个任意类型 的值聚合成的实体，每个值都可以被称为结构体的成员。
结构体成员也可以称为“字段”

成员拥有自己的类型和值
成员名必须唯一
成员的类型也可以是结构体，甚至是成员所在结构体的类型

使用关键字type，可以讲各种基本类型定义为自定义类型。
基本类型包括整形、字符串、布尔等。
结构体是一种复合的基本类型，通过type定义为自定义类型，可以使结构体更便于使用。

结构体的定义

语法如下：

type 类型名 struct {
	成员1 类型1
	成员2 类型2
	//。。。
}

含义：

类型名：标识自定义结构体的名称，在同一个包内不能包含重复的类型名。
struct{}：表示结构体类型。type 类型名 struct{}可以被理解为将struct{}结构体定义为类型名的类型，也就是说之后可以将这个结构当作一种数据类型来使用，就像int、float等。
成员1、成员2…：表示结构体成员名。结构体中的成员名必须唯一。
类型1、类型2…：表示结构体各个成员的类型。

当一个结构体被定义后，就可以像使用其他数据类型那样对其进行变量的定义、初始化等操作。因为他也是数据类型的一种，区别在于int、float这些是Golang定义好的，自定义结构体是你自定义出来的。

访问结构体成员

当需要访问结构体的成员时，使用英文句点号.操作符，格式如下：

结构体.成员名

结构体作为函数参数

既然已经说了自定的结构体类型也是一种数据类型，那么当然也是支持像其他数据类型那样当作参数传入函数内部使用。

结构体指针

与其他数据类型一样，结构体也可以使用指针，一般称为结构体指针，定一语法如下：

type Books struct {
title string
author string
subject string
press string
}

var structPoint *Books

以上定义的指针变量可以存储结构体变量的内存地址。

也可以使用&来取出结构体的地址。
使用.来访问结构体指针的结构体成员。

切片类型

切片(slice)是对数组的一个连续片段的引用，所以切片是一个引用类型，这和Pythn中的list或者C/C++中的数组类型。

这个片段可以使整个数组，也可以是由起始和终止索引标识的一些项的子集。
切片的内部结构包含内存地址、大小和容量。切片一般用于快速的操作一块数据集合。

切片的结构体由3部分构成，
在这里插入图片描述

地址指针(pointer)：指向一个数组的指针
长度(len)：代表当前切片的长度
容量(cap)：当前切片的容量
cap的总是大于等于len。

切片默认指向一段连续内存区域，可以使数组，也可以是切片本身。从连续内存区域生成切片是常见的操作。
语法：

slice [开始位置:结束位置]

含义：

slice: 目标切片对象
开始位置：对应目标切片对象的起始索引
结束位置：对应目标切片的结束索引

例子：

var a = [3]int{1, 2, 3}
fmt.Println(a, a[1:2])

从数组或切片生成新的切片拥有如下特性：

取出的元素数量为 “结束位置-开始位置”
取出元素不包含结束位置对应的索引，切片最后一个元素使用slice[len(slice)]获取；
如果缺省开始位置，则表示从连续区域开头到结束位置
如果缺省结束位置，则表示从开始位置到整个区域的末尾
如果两者同时缺省，则新生成的切片与原切片等效
如果两者同时为0，则等效于空切片，一般用于切片复位

在根据索引位置取切片slice元素值时，取值范围是(0～len(slice) - 1)。如果超界，则会报运行时错误。在生成切片时，结束位置可以填写len(slice)，不会报错。

从指定范围中生成切片

切片和数组密不可分。如果将数组理解为一栋办公楼，那么切片就是把不同的连续楼层出租给使用者。在出租过程中需要选择开始楼层和结束楼层，这个过程就会生成切片。

切片的使用有点像C语言里的指针，但是C的指针可以做运算，但是有内存越界的风险，所以c的指针既是高效的东西但是也存在风险。

切片在指针的基础上增加了大小，约束了切片对应的内存区域。在切片使用过程中，无法对切片内部的地址和大小进行手动调整，因此切片比指针更安全、强大。

表示原有的切片

如果开始位置和结束位置都被忽略，则新生成的切片与原有切片一模一样，并且生成的切片与原切片在数据内容上也是一致的。

b := []int{6, 7, 8}
fmt.Println(b[:])

输出：

[6, 7, 8]

充值切片，清空拥有的元素

如果把切片的开始和结束位置都设置为0，则生成的切片将变空

b := []int{6, 7, 8}
fmt.Println(b[0:0])

输出：

[]

直接声明新的切片

除了可以从原有的数组或者切片中生成新的切片外，当然也是支持直接声明新的切片。其他类型也可以声明为切片类型，用来表示多个相同类型元素的连续集合。因此，切片类型也可以被声明。
语法如下：

var name []Type

其中name表示切片的变量名，Type表示切片的元素类型。

还记得数组是如何声明的吗

var name [10]string
var name = [...]string{"sss", "fff", "fff"}

对比下切片的声明：

var name [string]
var name = []string{"djeda", "fjeaf", "fdhadha"}

这是不是非常清晰，二者语法十分相近，只不过切片在声明时，方括号内部是空的，而数组是非空的。

map类型

map定义

Golang中map是一种特殊的数据类型，一种元素对(pair)的无需集合。元素对包含一个key(索引)和一个value(值)，所以这个结构也被称为关联数组或者字典。这是一种能够快速寻找值的理想结构：给定了key，就可以迅速找到对应的value。
声明语法：

var name map[key_type]value_type

其中，name为map的变量名，key_type为键类型，value_type为健对应的值的类型。

在[key_type]和value_type之间允许有空格。
map可以动态增长，为初始化时，map的值为nil，使用len()可以获取map中的键值对的数目。

可以使用make()函数来构造map，但不能使用new()函数来构造map。
如果错误的使用new()函数分配了一个引用对象，则会获得一个空引用的指针，相当于声明了一个未初始化的变量，并取了它的地址。

map容量

与数组不同，map可以根据新增的元素对来动态的伸缩，因此不存在固定长度或者最大限制。
但是可以标明map的初始容量capacity。
语法如下：

make(map[key_type]value_type, cap)

当map容量增长到容量上限时，如果在增加新的元素对，则map的大小会自动加一，所以出于性能的考虑，对于map的大数据量或者扩充快的，最后实现注明容量。
这时会在定义时，直接申请这么大的容量，虽然可能不用，但是如果不这样做，就会在每次增加时进行内存的申请。

切片作为map的值

可以将value定义为切片类型，例如[]int等，就可以实现一个key对应一组值，这和python内的dict的value为list相同。

同理在切片内也可以嵌套map，形成复杂的数据结构。
但是在数据量大时，并不建议这么做，这时处于性能的考虑。