Go字符串底层是如何存储的?

栀花谢了春红

已于 2024-08-06 21:34:40 修改

阅读量194

点赞数 8

文章标签： go

于 2024-08-06 21:32:01 首次发布

本文链接：https://blog.csdn.net/m0_73391639/article/details/140966829

版权

字符和数字的映射表就是字符集。utf-8是unicode字符集的一种。

定长编码：取32字节定长 -> 浪费内存

go是如何编码的？

go采用的是utf-8编码，utf-8采用变长编码方案：

U+0000 至 U+007F: 0xxxxxxx
U+0080 至 U+07FF: 110xxxxx 10xxxxxx
U+0800 至 U+FFFF: 1110xxxx 10xxxxxx 10xxxxxx
U+10000 至 U+10FFFF: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

其中x表示有效数据位，10开头的字节被称为继续字节（continuation bytes），用于扩展字符的编码空间。举几个例子：

ASCII字符'A'（U+0041）在UTF-8中编码为：01000001
Unicode字符'€'（U+20AC）在UTF-8中编码为：11100010 10000010 10101100
Unicode字符'😀'（U+1F600）在UTF-8中编码为：11110000 10011110 10011000 10000000

go1.22是如何存取字符串的？

首先说c是如何存储字符串的，字符串标识指向一个内存地址，取字符串时会一直读取到\x00，这也就限制了c字符串中不允许出现\x00。

go在底层定义的string的数据结构为：

 type stringStruct struct {
     str unsafe.Pointer  // 指向字符串首地址的指针
     len int  // 字符串的字节长度，而不是字符长度
 }

如何脱离只读内存的限制?

go认为字符串是只读类型，那如何脱离只读内存的限制呢？

 s1 := "ctf"
 s2 := ([]byte)(s1)
 s2[0] = 'C'

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

栀花谢了春红

关注关注

8
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Go字符串底层是如何存储的?

go采用utf8存储，底层结构体为字段和字节长来存取字符串
复制链接

扫一扫

Go 数据类型篇之字符串及底层字符类型

weixin_59284282的博客

06-28

284

在 Go 语言中，字符串是一种基本类型，默认是通过 UTF-8 编码的字符序列，当字符为 ASCII 码时则占用 1 个字节，其它字符根据需要占用 2-4 个字节，比如中文编码通常需要 3 个字节。

Go语言string底层结构与实战

分享代码与人生

02-25

593

学会golang中string底层结构，掌握string用法，并避坑，让你彻底掌握string用法。

参与评论您还未登录，请先登录后发表或查看评论

golang 字符串 底层为啥设计为字节数组存储

m0_37678007的博客

12-06

430

虽然字符串是不可变的，但 Go 语言提供了一些字符串操作函数和方法，允许在不改变原始字符串的情况下创建新的字符串。这些设计选择在提供高性能的同时，确保了字符串的安全性和可靠性。UTF-8 编码： Go 语言中的字符串采用 UTF-8 编码，其中每个字符可能由多个字节组成。不可变性： 字符串的不可变性提供了一定的安全性。性能：字节数组的访问速度很快，可以通过索引直接访问单个字节。内存分配：字节数组的大小是已知的，这使得字符串的长度可以在常量时间内获取。这有助于避免在运行时发生重新分配和复制的开销。

Go 常见错误集锦 | 字符串底层原理及常见错误

Go中国

11-21

331

大家好，我是 Go 学堂的渔夫子。string 是 Go 语言的基础类型，在实际项目中针对字符串的各种操作使用频率也较高。本文就介绍一下在使用 string 时容易犯的一些错误以及如何避免...

深度解析Go字符串

最新发布

weixin_53623989的博客

02-03

1252

Go语言中的字符串是一种不可变的字节序列，它在编程中扮演着重要的角色。接下来将深入探讨Go字符串的基本概念、常见操作、性能优化，以及最佳实践，旨在帮助大家更好地理解和利用Go语言中的字符串。

go 字符串与切片数据结构底层分析

刘小雨的博客

05-27

880

文章目录1. 字符串切片1.1 查看字符串大小1.2 len 中表示的什么长度？1.3 go中字符编码问题（变长编码）1.4 Unicode 字符集1.5 utf-8变长编码1.6 字符串存储图画表示2. 字符串访问与切分2.1 下标访问2.2 range 访问，正确2.3 go 底层如何判断汉字占3字节，英文占1字节？2.4 字符串的切分3. slice 数据结构3.1 切片的本质3.2 切片的创建3.3 汇编分析3.4 分析代码3.5 切片的访问3.6 切片的追加3.7 解释并发不安全现象 1. 字符串

为什么说 Go 语言字符串是不可变的？

AlwaysBeta 的专栏

06-02

313

最近有读者留言说，平时在写代码的过程中，是会对字符串进行修改的，但网上都说 Go 语言字符串是不可变的，这是为什么呢？这个问题本身并不困难，但对于新手来说确实容易产生困惑，今天就来回答一下。如果一定要这么做的话，需要对字符串进行一个转换，转换成。以上就是本文的全部内容，如果觉得还不错的话欢迎。和切片的结构很像，只不过少了一个表示容量的。切片，然后让指针指向了新的地址。Go 实际上是重新创建了一个。类型，修改之后再转换回。

[Go] GO中的字符串底层数据结构

程序员老狼专注开发aigc或客服系统应用

12-25

243

一个字符串是一个不可改变的字节序列，字符串通常是用来包含人类可读的文本数据。和数组不同的是，字符串的元素不可修改，是一个只读的字节数组。每个字符串的长度虽然也是固定的，但是字符串的长度并不是字符串类型的一部分。由于Go语言的源代码要求是UTF8编码，导致Go源代码中出现的字符串面值常量一般也是UTF8编码的。源代码中的文本字符串通常被解释为采用UTF8编码的Unicode码点(rune)...

Go字符串拼接-源码+Benchmark

非晓为骁的博客

02-18

934

想要写这个的目的在于，平时开发业务的时候会用到比较多的字符串拼接，刚好看了一些源码，就想说通过benchmark和底层的一些源码来看下常见字符串拼接的一些性能和原理。

Go语言使用字符串的几个技巧分享

01-01

一、字符串底层就是一个字节数组这真的非常重要，而且影响着下面的其他几个技巧。当你创建一个字符串时，其本质就是一个字节的数组。这意味着你可以像访问数组一样的访问单独的某个字节。例如，下面的代码逐个打印...

Go语言底层原理剖析.pdf

11-30

Go语言支持多种类型，包括整数、浮点数、复数、字符串、数组、切片、哈希表等。类型转换是Go语言中非常重要的一部分，类型转换可以在编译时和运行时进行。函数调用规范函数调用是Go语言中非常重要的一部分，函数...

简单谈谈Golang中的字符串与字节数组

09-19

在Go的类型系统中，字符串是通过`string`关键字定义的基本类型，它的底层实现是一个`StringHeader`结构体。这个结构体包括两个字段：`Data`和`Len`。`Data`是一个指针，指向字符串的起始内存地址，`Len`则是字符串的...

randgen:Golang软件包，用于生成随机字符串和数字

03-08

4. **安全性和性能**：由于`randgen`是用Golang编写的，它利用了Go语言的并发特性，可以在多核系统上高效运行。同时，它可能使用了安全的随机数生成算法，保证生成的数据不易被预测。 5. **易用性**：该软件包的API...

C-字符串处理算法与实现

06-07

在编程领域，C语言是基础且重要的编程语言之一，它提供了对底层内存操作的强大支持，尤其是在处理字符串方面。本文将深入探讨C语言中的字符串处理算法及其实现，主要围绕标题和描述中的关键点展开：自定义函数实现C-...

哈希字符串

02-11

总结起来，“哈希字符串”项目是Go语言中实现SHA-256哈希的一个便捷工具，它通过简单的接口提供了一种高效、可靠的方式来处理字符串的哈希需求，适用于各种需要数据校验和保护的应用场景。通过使用这个库，开发者...

low:Golang中的底层数据类型和utils

05-17

Golang中的底层数据类型和utils。稳定的低级功能集是强大体系结构的基础。它注重稳定性，并要求较高的测试覆盖率。地位这个项目一直在支持我们所有其他的go项目。安装 go get github.com/openacid/low/... ...

go&redis数据结构的底层实现.docx

07-23

Go 语言与 Redis 数据结构的底层实现 Go 语言是现代化的静态类型语言，专门设计用于构建可靠、简单、快速和高效的软件系统。Go 语言的设计目标是提供一种灵活、简洁、可靠的语言，易于开发者使用和维护。指针类型...

interview-go:golang面试题集合

04-29

Go语言的GPM调度器是什么？ Goroutine调度策略 goroutine调度器概述 Redis基础 Redis 基础数据结构 Redis中的底层数据结构 Redis持久化的原理及优化 Redis中内存淘汰算法实现 Redis主从复制原理 MySQL相关 MySQL...

python字符串底层原理

12-16

Python中的字符串是不可变的序列，底层实现是通过Unicode编码的字符数组来表示的。在Python解释器中，每个字符都是一个Unicode码点，每个码点占用4个字节。当我们声明一个字符串时，Python会在内存中分配一段连续的空间来存储这个字符串的字符数组，同时还会记录这个字符串的长度和其他相关信息。由于字符串是不可变的，所以在对字符串进行修改时，Python会重新分配一段新的内存空间来存储修改后的字符串，原来的字符串则会被释放。以下是一个演示字符串底层原理的例子： ```python s = 'hello world' print(id(s)) # 输出：140563834947344 s = s + '!' print(id(s)) # 输出：140563834947408 ``` 在上面的例子中，我们首先声明了一个字符串s，然后通过id()函数获取了s的内存地址。接着，我们将s与一个感叹号拼接起来，这时Python会重新分配一段新的内存空间来存储修改后的字符串，并将s指向这个新的内存地址。最后，我们再次通过id()函数获取了s的内存地址，可以看到它已经发生了改变。