内容可寻址(CAS)

内容寻址存储(CAS)是一种基于文件内容的寻址方式,与传统的地址寻址不同,它通过文件内容的哈希值来定位文件。这种方式可以防止内容被篡改并确保文件的持久可用性,例如IPFS协议就采用了CAS思想。与地址寻址相比,CAS能避免因文件位置变动或删除导致的访问失败问题。内容寻址的优势包括文件完整性保证、单一实例存储和可能的快速检索。它适用于存储不易变动的重要文件,如合同和法律文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

是什么

内容可寻址(Content-addressable storage,content-addressed storage or CAS),这是一种基于内容的寻址方式。它主要被用于高速存储,且存储的内容不发生改变。

比如,目前的 IPFS 协议就借鉴了 CAS 的思想。

内容可寻址 vs 地址可寻址

目前的互联网中,我们最常见的是地址可寻址,比如给你一个 IP 地址,你可以找到相应地存储在这个地址上的内容。再比如,在 windows 下,我们可以通过路径找到自己文件存储的位置,如,D:\aaa\bbb\ccc.txt。

而 CAS 则是通过文件内容生成内容地址(通常是通过 hash 算法),在通过内容地址找到文件。

由此我们可以分析,在地址寻址时,如果一旦该地址对应的内容被删除,或者内容位置发生改变都会造成我们通过物理地址访问内容失败的情况。实际中,我们经常遇见某些网页 404,打开一个百度网盘资源的链接被告知链接失效的情况。

而基于内容可寻址的方式则可以避免这些情况,同时它还可以保证文件内容的完整性(不被篡改),因为内容地址是通过文件内容被 hash 之后得到的,一旦文件内容发生任何改变,则内容地址也会发生改变,也就是说文件 A 和 被修改的文件 A’ 已经不是同一指向的文件了。

内容寻址的优势

一部分优势在上面已经谈到了。

  1. 文件永久存储
  2. 保证文件完整性
  3. 单一实例存储:因为文件是基于内容寻址,所以整个 CAS 中,任何相同的文件地址都会被指向同一个内容地址,后期加入的内容都只是一个指向第一个内容地址的指针。当然实际中,我们可以对 CAS 中的文件内容进行备份处理
  4. 检索速度快(关于这一点暂时没有查到具体的原理解释)

适用范围

在我看来,CAS 可以起到对地址寻址的补充,比如对一些内容不易发生改变的文件(如,拟好的合同,法律文件)可以使用 CAS 进行存储

参考

Content-addressable storage
Benefits of Content-Addressed Storage
InterPlanetary File System
内容寻址的含义有哪些?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值