计算机存储空间大小换算(汉字->存储空间)
项目场景:在文本存储以及向量化场景中,经常会遇到客户问,我的1G文档对应的数据落地大概需要占用多少的磁盘空间呢,为此整理了一个换算方式。
存储单位换算方式
计算机存储单位以及对应的运算关系
- 1 Byte = 8个二进制位组成
- 1 KB = 1024 Bytes,即1千字节等于1024字节。
- 1 MB = 1024 KB,即1兆字节等于1024千字节。
- 1 GB = 1024 MB,即1吉字节等于1024兆字节。
- 1 TB = 1024 GB,即1太字节等于1024吉字节。
汉字的存储换算:
提示:以下是通用的计算规则,不同场景换算规则不一致,例如下面的中文标示的是UTF-8编码,其他的编码对应的运算关系存在不同。
向量的存储换算:
一个1024维度的向量是由1024个float数据组成,不同场景向量维度以及进度不一样,大家自行更正计算单位