SciChain: Blockchain-enabled Lightweight and Efficient Data Provenance for Reproducible Scientific Computing
1 研究背景和动机
在高性能计算系统上审计和再现科学应用的最新技术是数据溯源子系统。进展在于减少性能开销和提高用户查询灵活性,但数据出处的保真度往往被忽视---没有办法确保出处数据本身没有被捏造。
在HPC的背景下,使用基于区块链的溯源系统有不同的挑战:
1.空间效率低下,网络带宽消耗大、CPU周期被浪费在无意义的挖矿上。
2.现有的基于区块链的溯源系统构建方式:底层区块链基础设施是一个黑盒子,溯源服务通过调用
区块链基础设施提供的接口为更高级的应用程序工作,这种方式
较好的情况:溯源服务无法优化和定制
糟糕的情况:由于不能修改较低的区块链层,区块链的基础设施对HPC不适用。例如
1.计算节点没有本地磁盘,区块链不适用
2 计算密集或通信密集有不恰当的共识
3 多层存储架构不兼容
总结:一个非常理想的科学应用溯源系统应该在可靠性、伸缩性和适用性之间取得平衡。我们需要的是一个协议,这种协议要从不同的角度克服资源利用挑战,例如用更具成本效益的共识取代传统的计算密集型共识对节点实施内存约束,以限制节点间通信以降低网络开销
2 本文贡献
本文贡献:
1 提出了一种在HPC中实现安全可靠的分布式溯源的新体系结构。计算节点可以以最小的开销在本地内存中维护区块链
2 提出了一种共识机制POST 思想:共识不仅来自于其他节点,还来自远程共享存储