本来想着,我读论文后,可以写出来比较完整的论文总结来给给位小伙伴看一下,但是发现自己的笔力还不够深厚,所以就只能随便写写了。
祸害的第一篇 AccountTrade: Accountable Protocols for Big Data Trading Against Dishonest Consumers
因为我前面对于数据共享过程中的问题有了一些初步的思考,所以后面就看了这篇论文。
论文的开头讲的是随着大数据的出现,数据销售业务也正成为一项有前途的业务。所以就有了数据贸易平台。
###这里初步理解为这个论文也是针对中心化数据交易进行考量的。
论文里面假设存在交易不端行为包括以下几种:逃税、拒绝购买和转售他人的数据集。tax evasion, denial of purchase, and resale of others’ datasets
###所以,这里我的疑惑点就是,如果是在区块链中,还会存在上述问题吗?
###假设1,在区块链中,因为用户处于相对匿名状态,如果出售的是数据的话,感觉很难在实际环境中找到数据拥有者,所以就谈不上逃税的问题了?但是是否乐意这样做呢?
就是在区块链上,发布一个智能合约,当有数据进行售卖的话,是够可以将获得的一部分代币转给相关社区?
###假设2,转售他人数据集,这个因为在中心化数据交易平台里面,这个问题是可能被平台这方人员采取一定措施解决的,因为毕竟用户都需要上传和下载数据,平台可以将其上传的数据与平台自身拥有的庞大数据库做一个相似性检测,本文也是提出了一个类似指数来解决这个问题。如果是在区块链里面要上传一份数据集的话,首先由于区块本身的大小限制,数据要上传的话,是不是需要经过多次划分?其次,数据上传以后,数据会被优先打包吗?
本论文所做的工作:对交易中的问责模型进行了形式化定义,并用形式化语言进行了自动证明和理论分析,对AccountTrade实现的问责进行了形式化证明。
本文设计过程中遇到的困难。
1 合法和非法的边界很难定义。
这在一定程度上是因为不诚实的卖家在试图转售他人的数据集之前,可能会对其他人的数据集带来各种干扰,而定义数据应在多大程度上受到干扰才能独立于原始数据集并不属于计算机科学领域。
2 数据代理者用巨大的容量来存储数据,但是有非法者直接扫描到其拥有的所有数据。
3 最后,本协议不该给普通消费者带来不可忽视的开销。
###思考1 数据集干扰后,在区块链里面可以防范这种行为吗?或者对于这种数据集处理后的特征有没有什么处理方式?这关系到了责任问题。
本文的贡献总结如下:
贡献1
我们正式定义了大数据交易的符号和计算责任模型,并设计了可证明责任的责任协议上传、检查和下载(证明见§IV)。
贡献2
为了有效地检测非法转售行为,我们提出并利用了与现有数据集相似性比较机制中不同数据类型一致的唯一性指标。值得注意的是,目前还没有这种机制可用于表类型数据集,我们提出了一种新的机制来有效地度量表数据集的相似性。
贡献3
AccountTrade可以很好地随数据代理的规模而扩展,即它们承载的数据集的数量和价量。具体地说,不管数据代理的规模如何,在用户端引入的额外开销保持不变,并且在代理端产生的额外开销仅随数据集的数量而线性增长,而不管数据集的数量如何。
上述暂时就是我在这篇论文中的所有收获了。
之前我还看到过一篇双层区块链的论文,下面应该会对其进行阅读,期待下次见面。
==============================================================