2019年3月14日,TokenGazer发布了区块链项目Storj评级报告。当前TokenGazer往期的项目评级报告、深度研究报告、加密货币月报等均已收录在官方网站:www.tokengazer.com。
1
项目背景
1.1 云存储市场背景
互联网应用以来,人们正在产生越来越多的数据。据统计,从 2010 年到 2020 年,世界每年创造的数据量在以 42% 的复合增长率增长;到 2020 年将达到每年产生 44ZB (1 ZB = 1012 TB)的数据量[1]。
图1:全球数据量增长状况
来源:The International Data Center (IDC)
上图中,结构化数据是指高度组织化的数据,主要由具有定义其含义的行和列的表组成,如电子表格和数据关系库等;而非结构数据除此之外的其他数据,包括电子邮件、电子书籍、Word文档、音频、视频等等。
在此背景下,人们存储数据源的位置和方式的问题变得越来越重要。从内部部署存储迁移到云存储一直是过去十年的主题,云存储市场发展迅猛,并且呈现加速发展的趋势。从下图我国云存储市场从2012年 - 2017年的发展情况可以清晰地看到这种趋势。
图2:中国云存储市场规模
数据来源:中国产业信息网
根据测算,2017年全球云存储(不含硬件)市场规模为147.24亿美元,中国云存储市场规模为13.55亿美元。
目前,谷歌、亚马逊、苹果、Facebook、腾讯、阿里等科技巨头控制着世界数据的很大一部分,整个云储存市场是由它们主导的。这种高度中心化的存储局面,让数据的安全性、隐私性面临巨大的挑战。同时,这还导致存储的昂贵。
根据统计,云存储的价格每年下降不到10%(见下图),但同时绝大多数存储设备的运行容量低于25%[2]。如果将世界上大量未利用的存储空间利用起来,涌入云存储市场的供应将有效地降低存储价格。
图3:主要云存储项目价格随时间变化图
图片来源:Storj Blog
MIT Sloan Blackchain Technologies 课程中提出一种观点,认为区块链技术的重要作用是降低验证成本和降低网络效应成本。因此,判断一个行业是否有必要采用区块链技术可以从“验证成本”和“网络效应成本”来进行评价。云存储领域寡头垄断严重,说明其网络效应成本较高;目前去中心化云存储仍面临着一定的技术难题,降低验证成本有一定的挑战,因此该领域目前处于下面的位置。
图4:去中心化云存储在“网络效应-验证成本四象限”中的位置
TokenGazer 认为,去中心化存储是目前比较明确的区块链应用方向,它能够以更低的成本获取用户,有效降低网络效应成本,以安全、去信任、点对点的方式,为云存储提供新的解决方案。虽然在降低验证成本方面,去中心化云存储还面临诸多的技术挑战,但已经有很多团队都在追逐这个机会,Storj 正是其中之一。
1.2 项目简介
Storj 是由盈利性科技公司 Storj Labs 发起并开发的开源项目,它是建立在以太坊上的分布式存储平台。用户可以在 Storj 平台上使用其平台通证 STORJ 购买存储服务,也可以提供闲置的存储空间并获得 STORJ 通证回报。相对于中心化的云存储服务,这种分布式的云存储能够给用户提供更高的安全性、隐私性,并通过利用闲置的存储资源,提供更便宜的价格。
2
技术评估
2.1 技术架构
Storj 的技术架构围绕着四项操作展开:
存储数据:用户存储数据时,客户端会对其数据加密并将其分解成多个碎片。这些碎片通过网络分发给节点。与此同时,客户端会生成包含有关再次查找数据的位置的信息的元数据。
检索数据:用户检索数据时,客户端将引用元数据以识别先前存储的块的位置,然后检索这些碎片,并在客户的本地机器上重新组装原始数据。
维护数据:当数据的冗余度低于某个阈值时,将重新生成并替换缺失部分的必要数据。
支付:用户为网络所提供的服务付费。
Storj 设计了八个独立的组件,它们组合起来会形成满足上诉要求的架构。这八个组件分别是:
① 存储节点
存储节点的作用是存储和返回数据。 除了可靠地存储数据之外,节点还提供网络带宽和响应能力。 存储节点的选择基于以下的各种标准:响应时间、延迟、吞吐量、带宽上限、足够的磁盘空间、地理位置、正常运行时间、经审计的准确响应的历史记录等等。
存储节点提供存储服务,并获得相应的经济回报。
② 点对点通信和发现
Storj 网络上的所有节点都通过标准化协议进行通信。该框架要求这个协议:
提供节点可达性,即使在可能的情况下面对防火墙和NAT也是如此。这可能需要STUN ,UPnP ,NAT-PMP 等技术。
提供 S / Kademlia 中的身份验证,其中每个参与者直接以加密的方式验证与其对话的节点的身份,以避免中间人攻击。
提供完备的隐私。在带宽测量等情况下,客户端和存储节点能够通信而不存在任何窃听风险。协议确保默认情况下所有通信都是隐私的。
③ 冗余
在去中心化存储网络中,任何一个存储节点都可能随时脱机。为了达到特定的耐久水平(定义为面对故障时数据仍然可用的概率),去中心化存储领域的很多产品都采用复制的方式来达到冗余。