数字货币创新性分析

本文主要介绍本人发表在MSR2020上的一篇数字货币相关分析的文章,初次写博客,多有瑕疵,请多指正!
2013年以来,比特币的巨大成功推动了基于区块链技术的加密数字货币的快速发展。至2019年,加密数字货币的发展呈现出了三种特征:种类多,发布快,价格变化大。据统计,在2019年8月,市场上有效的数字货币已经超过2300并且还是迅速增长;至2018年以来,每月的新增ICO(初始币发行)项目超过60;比特币经历了巨大的价格变化,其在2017年12月17日价格超过20000美元,而在2018年12月30日跌至3830美元。在数字货币的快速发展过程中,由于快速发布的新生货币质量得不到保证,可能存在一些隐藏的发展隐患,从而导致数字货币的市场脆弱而易变。

数字货币数量及市值变化
数字货币的发展其实是一个十分复杂的演变过程。作为第一个出现的数字货币,比特币目前占有了接近70%的市场份额。而后出现的数字货币可以分为两类:Altcoins(替代币)和Tokens。顾名思义,替代币是指和比特币具有相同或者相似功能,可以替代比特币的数字货币。一般来讲,替代币拥有其自己的链。而tokens则通常是建立在已有区块链上(比如以太坊)为区块链提供衍生服务的数字货币,其功能与实现较为多样。由于替代币通常需要区块链作为其技术基础,其来源也可以大致分为两类:一类是比特币的变体,即使用比特币的开源协议,修改其部分代码,实现一个有一定差别的新链;另一类是自己开发的数字货币,他们一般会创建自己的区块链,来支撑起他们自己的数字货币。而在发布的大量替代币中,大部分都是比特币的变体。
不同时期发布的货币其实现语言占比

在选择可以投资的数字货币时,一个很重要的特征就是其代码创新。我们在2018年9月发布了一个报告,其中发现:“近90%的货币都和其他货币分享了80%的代码”,而这么严重的代码克隆现象实际上很大程度上引起我们对于数字货币代码创新性的担忧。然而,大部分投资者实际上将注意力放在市场的变化趋势上,而研究人员关心则是数字货币技术的发展和安全问题。更让人迷惑的是,在以技术实现为关键支撑的数字货币市场上,数字货币的市场价值似乎与其技术实现并无多少关系。因此,在这种情况下,针对数字货币的创新性研究以及分析数字货币的创新与其市场前景之间的关系就显得尤为重要。
在这里插入图片描述
在这篇文章里,我们将以替代币的创新性分析作为研究重点,希望利用计算机领域的知识对替代币的代码创新性方面进行分析。为了便于理解,我们提出三个研究问题并进行分析解答,以帮助大家有一个更清晰的理解:
问题1:数字货币之间到底有多少代码是相似的?
创新性。很多替代币都描述自己拥有独特和创新的功能,并有能力作为比比特币更好的替代品。而这种能力实际上在于其技术上的创新,即源代码的创新。然而,它们与其它现有加密货币共享代码的程度仍不得而知。因此,在第一步,我们想要从替代币代码的相似度出发,回答替代币的代码创新状况。

问题2:替代币共享代码的关系是怎样的?
关系。软件开发通常不是从零开始的。替代币的实现可能来源于一个或多个模板,许多替代币也可能共享类似的源代码。因此,我们则需要进一步分析来揭示他们传承的过程。而现有的聚类算法忽略了聚类对象的顺序,不能直接应用到我们的工作中。第二步,我们将对替代币进行家族性分析,进一步探索它们之间的内在联系。

问题3:代码创新性和市场前景之间到底存在着怎样的关系?
市场前景。和自然法则一样,习性相近的生物会争夺相同的资源,使用相同代码的替代币也有可能经历更大的竞争。因此,替代币的创新性可能会影响到其市场前景。然而,数字货币所处的复杂环境使得分析其关系非常困难。在最后一步,我们希望通过回答问题3来深入探讨市场前景和创新之间的关系。
接下来,我们将针对以上三个问题,介绍研究的具体过程和相应结果。
总体概览

1.数字货币的创新性分析
方法:我们从仓库的克隆和代码的克隆两个方面对数字货币的创新性进行了研究。首先,我们爬取了替代币在GitHub上仓库的克隆信息,分析其中显式的代码分享有多少。第二,我们搜集了2018年3月28日485个数字货币的源代码和2018年9月28日566个数字货币的源代码,使用代码克隆检测技术检测了数字货币之间真实共享的代码有多少。最终,我们的发现如下:
发现1: 只有大约15%的仓库和其他仓库有克隆关系。在我们搜集的983个数字货币的989个仓库中,只有146个和其他仓库有克隆关系。其中,比特币的仓库是被克隆最多的仓库,有12个仓库克隆该仓库。而PIVX的仓库是第二多被克隆的仓库,有7个仓库克隆该仓库。除此之外,比特币的仓库还是34个仓库的源仓库,也就是说,除了12个仓库直接克隆了比特币,还有22个仓库也来源于比特币的仓库,但其中存在多层克隆关系。
发现2:超过85%的仓库和其他的仓库分享了80%的代码。下图展示了仓库与已有仓库(出现比该仓库时间早的仓库)之间相似度的分布情况。在两个数据集的检测结果中,90%-100%的部分都是最大的,占比超过了70%。而在80%-90%之间,也有接近15%的占比。
在这里插入图片描述

发现3:33.92%的货币都与超过50个货币分享了80%的代码。其中比特币和12个货币共享了80%的代码,而PIVX和48个货币都共享了80%的代码。这种大量货币的代码共享揭示了数字货币之间还有更复杂的相似关系。

2.数字货币家族关系分析
方法:为了进一步分析数字货币之间的关系,我们模拟人类的家族图谱,提出了基于时序关系的数字货币家族构建方法。该方法根据货币出现的先后顺序,按照货币间的代码相似度,构造出数字货币的树状家族图谱。下图为家族构建的具体算法。

在这里插入图片描述
下图即为一家族图谱的部分示例。家族内部的货币拥有这较高的相似度,并且货币之间存在继承关系。如Zoin的父节点为HexxCoin,代表着和HexxCoin是与Zoin最相似的数字货币,且HexxCoin出现时间比Zoin早。根据以上构造方法,我们发现以下现象:
在这里插入图片描述

发现1:大多数数字货币集中在几个家族中。下图显示了不同家庭中的货币数分布。其中,72.4% (566个货币的410个)聚集在8.8% (57个家族的5个)的家族中。它遵循80/20原则,这表明在技术上更接近的群体中存在更紧密的聚合。
在这里插入图片描述

发现2:较早发行的货币更容易生成较大的家族。拥有提前发行的货币家庭有可能拥有更多成员。我们把这种现象归因于两个原因。一个是,我们提出的算法从发行较早的货币开始构建家族,拥有提前发行的货币家族将会变得更大。另一个原因是,较早发行的货币比较较晚发行的货币更有影响力。最初的几枚货币是之后货币的参考原型,尤其是比特币,它对其他货币的技术实现拥有巨大的影响。
在这里插入图片描述

3.数字货币的创新性与市场前景之间的关系
方法:为了探究数字货币的创新性与市场前景之间的关系,我们按照创新性的大小将数字货币分为多类,如高相似度VS.低相似度,有代码VS.无代码等等。之后根据各类货币一段时间后的数量及市值变化,分析其中创新性与市场前景之间的关系。
发现1:有代码链接的货币比没有代码链接的数字货币更有可能拥有较好的市场前景。
发现2:低相似度的货币比高相似度的货币更有可能拥有较好的市场前景。
在这里插入图片描述

发现3:小家族中的货币比大家族中的货币更有可能拥有较好的市场前景。并且小的货币家族其成员倾向于增加,大的货币家族其成员倾向于减少。最终整个数字货币家族会朝着中等规模的家族发展。
在这里插入图片描述

该篇文章只对论文中的部分内容进行介绍,具体内容可以查看论文。
论文引用格式:
Ang Jia, Ming Fan, Xi Xu, Di Cui, Wenying Wei, Zijiang Yang, Kai Ye,and Ting liu. 2020. From Innovations to Prospects: What Is Hidden Behind Cryptocurrencies?.
In 17th International Conference on Mining Software Repositories (MSR ’20), October 5–6, 2020, Seoul, Republic of Korea. ACM, New York, NY, USA, 12 pages. https://doi.org/10.1145/3379597.3387439

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值