系统模型
- 威胁模型
K个数据提供者,一个数据请求者,都可能是不诚实的。
提供数据的质量:可能不准确有偏见。
数据的隐私性:攻击者尝试推断攻击,合谋攻击。
数据的授权:一旦原始数据被分享,数据拥有者会失去控制权。 - 我们提出的架构
许可链模型和联邦计算模型。
许可链:为设备之间建立安全连接。矿工是基站节点和路边单元节点。两种类型交易:检索交易和数据分享交易。
安全数据分享的区块链和联邦学习
- 标准化的加权图
定义一个两步距离度量学习方案来检索文本数据:量化特定数据的相似度。
每个用户ni,有数据txi,权重wni,每个边连接节点ni和nj,以及权重。
使用权重矩阵A=aij来表示这个图,所有的文本文件转化为图。
将这些图合并成一个全局图。在根据一些聚类算法对数据集进行分类,按照分类结果对参与者进行分组。 - 多方数据检索
这里只使用区块链来检索数据,原始数据被存储在数据拥有者的本地。数据提供者加入时要有一个数据资产证明,说明数据的分类、类型和大小。
区块链交易:
检索交易:哈希指针;ID;数据类别;数据类型;数据大小;时间戳。
数据分享记录: