什么是区块链?
- 去中心化的、分布式的、区块化存储的数据库
- 存储全部账户余额及交易流水的总账本
- 每个节点有完整的账本数据
- 账本数据记录了全部的历史交易数据
- 交易数据存储在区块上
- 每个区块包含前一区块ID及HASH,形成链
区块链基本原理
如果把区块链作为一个状态机,则每次交易就是试图改变一次状态,而每次共识生成的区块,就是参与者对于区块中所有交易内容导致状态改变的结果进行确认。- 交易(Transaction):一次操作,导致账本状态的一次改变,如添加一条记录
- 区块(Block):记录一段时间内发生的交易和状态结果,是对当前账本状态的一次共识
- 链(Chain):由一个个区块按照发生顺序串联而成,是整个状态变化的日志记录。
区块链要解决的问题
- 如何去中心化地共享数据?
- 如何确保账户不被冒用?
- 如何确保账户余额足够?
- 如何确保交易记录不被篡改?
- 谁负责记账?
- 怎么保障记账者的可信?
- 怎么保障记账者的积极性?
区块链特性
- 去中心化
- 开放性(没有限制,开源,数据公开)
- 去信任(仅信任机器)
- 自治性,集体维护
- 可靠的数据库(不可更改,永远可访问)
- 匿名性,隐私保护
核心技术
P2P网络、数字签名、区块化数据库,竞争记账权、共识算法、交易回溯。
二、P2P网络及通信技术(分布式计算网络)
自动发现
- 通过种子文件,获取初始节点(地址及端口)
- 连接初始节点,获取初始节点知道的Peer
- 把自己的地址及端口广播给各个Peer
- 接收各个Peer广播的地址信息,构建出网络的全貌或片段
技术领域
- 分布式存储、分布式计算、分布式协同
- 组播
- 流媒体
- 搜索引擎
通信协议
- napster 、Gnutella、eDonkey、 Bittorrent(文件分发协议)
- XMPP、Jabber(即时通信协议)
- Paxos 、Gossip(分布式系统状态同步协议)
- JXTA
使用HASH算法及非对称加密及签名技术
- 每个节点、每个人有唯一的一对公钥及私钥
- 公钥同时也是每个节点、个人的地址和账号
- 私钥是证明”我就是我“的唯一手段
- HASH算法对数据进行规整
算法
- RSA、Elgamal、D-H、ECC
- SHA256、 RIMPED160
通常使用椭圆曲线算法生成密钥对
- 比特币密钥长度:256位
- 公钥哈希值=RIMPED160(SHA256(公钥))
- 比特币地址=1+Base58(0+公钥哈希值+校验码)
- 校验码=前四字节(SHA256(SHA256(0+公钥哈希值)))
加密
- 发送方使用接收方的公钥加密数据
- 接收方使用本方的私钥解密数据
- 通常使用本方面交换对称加密的Key
签名
- 发送方使用HASH算法计算数据的HASH值
- 发送方使用本方的私钥加密HASH值,得到签名
- 接收方使用HASH算法计算数据的HASH值
- 接收方使用发送方的公钥解密签名得到发送的HASH值
- 比较两个HASH值的一致性
参考
- ElGamal算法,是一种较为常见的加密算法,它是基于1984年提出的公钥密码体制和椭圆曲线加密体系。既能用于数据加密也能用于数字签名,其安全性依赖于计算有限域上离散对数这一难题。在加密过程中,生成的密文长度是明文的两倍,且每次加密后都会在密文中生成一个随机数K,在密码中主要应用离散对数问题的几个性质:求解离散对数(可能)是困难的,而其逆运算指数运算可以应用平方-乘的方法有效地计算。也就是说,在适当的群G中,指数函数是单向函数。
- 椭圆曲线密码体制是目前已知的公钥体制中,对每比特所提供加密强度最高的一种体制。解椭圆曲线上的离散对数问题的最好算法是Pollard rho方法,其时间复杂度为,是完全指数阶的。其中n为等式(2)中m的二进制表示的位数。当n=234, 约为2117,需要1.6x1023 MIPS 年的时间。而我们熟知的RSA所利用的是大整数分解的困难问题,目前对于一般情况下的因数分解的最好算法的时间复杂度是子指数阶的,当n=2048时,需要2x1020MIPS年的时间。也就是说当RSA的密钥使用2048位时,ECC的密钥使用234位所获得的安全强度还高出许多。它们之间的密钥长度却相差达9倍,当ECC的密钥更大时它们之间差距将更大。更ECC密钥短的优点是非常明显的,随加密强度的提高,密钥长度变化不大。
- DH Diffie-Hellman算法(D-H算法),密钥一致协议,是由公开密钥密码体制的奠基人Diffie和Hellman所提出的一种思想。简单的说就是允许两名用户在公开媒体上交换信息以生成”一致”的、可以共享的密钥。换句话说,就是由甲方产出一对密钥(公钥、私钥),乙方依照甲方公钥产生乙方密钥对(公钥、私钥)。以此为基线,作为数据传输保密基础,同时双方使用同一种对称加密算法构建本地密钥(SecretKey)对数据加密。这样,在互通了本地密钥(SecretKey)算法后,甲乙双方公开自己的公钥,使用对方的公钥和刚才产生的私钥加密数据,同时可以使用对方的公钥和自己的私钥对数据解密。不单单是甲乙双方两方,可以扩展为多方共享数据通讯,这样就完成了网络交互数据的安全通讯!该算法源于中国的同余定理——中国馀数定理。
三、区块链化数据库
典型特征
- 去中心化的、分布式的、区块化存储的数据库
- 区块(Header + Body)
- 链
- 随机数
- 时间戳
- 包含父区块创建之后、本区块创建之前的全部交易;
- 满足某个条件的区块HASH;
a) SHA256(SHA256(version + prev_hash + merkle_root + ntime + nbits + x )) < TARGET
b) Target值由动态的难度系数确定,Target越小,难度越高;
参考
- 默克尔树是一种二叉树,由一组叶节点、一组中间节点和一个根节点构成。最下面的大量的叶节点包含基础数据,每个中间节点是它的两个子节点的哈希,根节点也是由它的两个子节点的哈希,代表了默克尔树的顶部。默克尔树的目的是允许区块的数据可以零散地传送:节点可以从一个源下载区块头,从另外的源下载与其有关的树的其它部分,而依然能够确认所有的数据都是正确的。
默克尔树协议对比特币的长期持续性可以说是至关重要的。在2014年4月,比特币网络中的一个全节点-存储和处理所有区块的全部数据的节点-需要占用15GB的内存空间,而且还以每个月超过1GB的速度增长。简化支付确认(SPV)协议允许另一种节点存在,这样的节点被成为“轻节点”,它下载区块头,使用区块头确认工作量证明,然后只下载与其交易相关的默克尔树“分支”。这使得轻节点只要下载整个区块链的一小部分,就可以安全地确定任何一笔比特币交易的状态和账户的当前余额。
- 默克尔树是一种二叉树,由一组叶节点、一组中间节点和一个根节点构成。最下面的大量的叶节点包含基础数据,每个中间节点是它的两个子节点的哈希,根节点也是由它的两个子节点的哈希,代表了默克尔树的顶部。默克尔树的目的是允许区块的数据可以零散地传送:节点可以从一个源下载区块头,从另外的源下载与其有关的树的其它部分,而依然能够确认所有的数据都是正确的。
四、记账权竞争及奖励制度(挖矿)
概述
为防止可预期的记账节点被控制或攻击,导致错误记账行为,区块链技术采用竞争记账权的做法:- 任何一个节点均可以参与记账,因而记账节点无法预期,也就不容易被控
- 竞争的过程就是看谁最先计算出满足条件的HASH值
- 每次计算必须以最后1个有效的区块为起点,必须消耗大量的计算机CPU,增加伪造记账数据的成本
- 计算的结果必须得到大部分节点的认可(共识算法),才会成为新的区块。实际算法中,如果该区块位于最长的区块链上,则为正式被认可的区块,也即大部分节点认可计算结果,并愿意在该结果下继续计算
- 这个过程被称为挖矿,或工作量证明(POW)。参与挖矿的节点称为矿工,协同挖矿的矿工联合体称为矿池
a ) 以前1区块为起点,计算满足条件的HASH值;
b ) 将计算的结果广播给其他节点;
c ) 其他节点验证计算结果无误时,认可该结果,并以该结果为起点重新进行计算;
d ) 单位时间内达到共识认可要求时,该区块成为正式认可的区块。 - 这个过程被称系统为鼓励挖矿的积极性,给予竞争成功的记账节点奖励
a ) 给予每个区块挖矿者直接的“现金”奖励。例如,比特币网络给予25个比特币,以太坊给予5个以太币;
b ) 以太坊:纳入该区块的交易的手续费,由发起节点和记账节点分成(发起75%,记账25%)。
参考
- 比特币使用的SHA256算法,会有2^256种输出,如果我们进行2^256+1次输入,那么必然会产生一次碰撞;甚至从概率的角度看,进行2^130次输入就会有99%的可能发生一次碰撞。不过我们可以计算一下,假设一台计算机以每秒10000次的速度进行哈希运算,要经过10^27年才能完成2^128次哈希!
这时要考虑一种情况:如果同时有两个矿工各自得到一个正确答案,并各自生成了一个区块广播出去会发生什么呢?这时候在区块链上同一个位置就有了两个区块,所谓的“分叉”就出现了。分叉是绝对不允许的,所以当矿工发现区块链分叉之后,会选择最长的一条继续计算,短的那条区块链会被丢弃。这里的长短,不是简单意义上的长短,而是工作量证明合计值最大的那个链。
- 比特币使用的SHA256算法,会有2^256种输出,如果我们进行2^256+1次输入,那么必然会产生一次碰撞;甚至从概率的角度看,进行2^130次输入就会有99%的可能发生一次碰撞。不过我们可以计算一下,假设一台计算机以每秒10000次的速度进行哈希运算,要经过10^27年才能完成2^128次哈希!
5. 共识机制
区块链是一种去中心化的分布式账本系统,由于点对点网络下存在较高的网络延迟,各个节点所观察到的事务先后顺序不可能完全一致。因此区块链系统需要设计一种机制对在差不多时间内发生的事务的先后顺序进行共识。这种对一个时间窗口内的事务的先后顺序达成共识的算法被称为“共识机制”。
5.1区块链和分布式系统容错的相同点
(1) Append only。
(2) 强调序列化(时间有序)。
(3) 少数服从多数原则。
(4) 分离覆盖的问题:即长链覆盖短链区块,多节点覆盖少数节点。
5.2 区块链和分布式容错的不同点
(1) 分布式系统容错,一般不考虑拜占庭问题,即假设所有节点只发生宕机、网络故障等非人为问题,并不考虑恶意节点篡改数据的问题;
(2) 分布式系统容错的一致性算法是面向日志(数据库)的,而区块链共识算法是面向交易的,前者可以作为后者的基础和技术保障;
(3) 区块链,更多地是解决拜占庭将军问题。
5.3拜占庭问题解决算法
(1) PBFT:投票机制,1个节点1票,少数服从多数,允许1/3的节点不可靠、但不能防止女巫攻击行为;
(2) 区块链引入奖励机制和惩罚机制(博弈)辅助解决问题,这是工作量证明 算法的基础,使得作恶成本高于收益,以阻止作恶行为;
(3) 交易永远没有最终状态,但有最接近最终状态的状态。通常经过6个区块的发展,交易被推翻的可能性极小。
5.4 参考
拜占庭问题:指系统中的节点可能出现任何错误,包括有意的误导,故意破坏系统,伪造签名,也包括故障、超时,重复消息等。
共识原理:当多个主机通过异步通讯方式组成网络集群时,这种异步网络默认是不可靠的,那么在这些不可靠主机之间复制状态需要采取一种机制,以保证每个主机的状态最终达成相同一致性状态,取得共识。根据FLP原理,Impossibility of Distributed Consensuswith One Faulty Process一文提出:在一个异步系统中我们不可能确切知道任何一台主机是否死机了,因为我们无法分清楚主机或网络的性能减慢与主机死机的区别,也就是说我们无法可靠地侦测到失败错误。
6. 主流共识算法
6.1 工作量证明(Proof of Work, POW)
(1) 工作量证明机制,使得区块的产生具有计算性难度,以增加攻击的成本;
(2) 从统计学角度,1笔交易在6个区块后被认为是明确确认且不可逆的。核心开发者认为,需要120个区块才能充分保护网络不受来自潜在更长的已将新产生的币花掉的攻击区块链的威胁;
(3) 尽管出现更长的区块链会变得不太可能,但任何拥有巨大经济资源的人仍有可能制造一个更长的区块链来伪造交易(51%攻击)。
6.2 股权证明机制(Proof of Stake,POS)
(1) 股权证明机制有很多不同变种,但基本概念是产生区块的难度与在网络里所占的股权(所有权占比)成比例;
(2) 解决POW的资源消耗问题。
6.3 瑞波共识机制(Ripple Consensus)
(1) 瑞波共识算法,使一组中心化的特殊节点列表达成共识;
(2) 初始特殊节点列表就像一个俱乐部,要接纳一个新成员,必须由51%的该俱乐部会员投票通过;
(3) 共识遵循这核心成员的51%权力,外部人员则没有影响力。由于该俱乐部由“中心化”开始,它将一直是“中心化的”;
(4) 瑞波系统将股东们与其投票权隔开,并因此比其他系统更中心化。
6.4 授权股权证明机制(DPOS)
(1) 每个股东按其持股比例拥有影响力,51%股东投票的结果将是不可逆且有约束力的,这点类似POS;
(2) 每个股东将其投票权授予一名代表,获票数最多的前100位代表按既定时间表轮流产生区块。每名代表分配一个时间段来生产区块;
(3) 所有代表将收到等同于一个平均水平的区块所含交易费的10%作为报酬;
(4) 该模式每30秒钟产生一个区块。
6.5 基于交易的股权证明机制(TaPOS)
(1) 通常POS代表是短时间的;
(2) TaPOS为股东们提供了一个长效机制来直接批准他们的代表的行为;
(3) 平均而言,51%的股东在6个月内可以直接确认每个区块;
(4) 而交易活跃流通的股份所占的比例,则平均10%的股东在几天内可以直接确认区块链。
7. 区块链种类
区块链主要公有链,联盟链,私有链这几类。
7.1公有链
(1) 运行在互联网;
(2) 完全的分布式;
(3) 数据节点数量多变且不可预知;
(4) 数据是公开的;
(5) 任何人都可以匿名参与;
(6) 运维成本较高,依赖奖励机制;
(7) 交易速度较慢。
7.2联盟链
(1) 由多机构联盟联合运行;
(2) 数据具有保密性;
(3) 数据节点是事先选择的;
(4) 节点间连接速度较快;
(5) 运维成本较低;
(6) 交易速度较快,交易成本较低;
(7) 数据可以被联盟修改。
7.3私有链
实际只使用区块链技术进行数据存储和交易处理,背离区块链基础的目标。
(1) 由单个机构运行;
(2) 数据访问和使用受限;
(3) 数据节点是事先选择的;
(4) 节点间连接速度较快;
(5) 运维成本较低;
(6) 交易速度较快,交易成本低;
(7) 数据可以被修改。
8. 区块链技术发展阶段
区块链技术的发展目前主要有3个阶段,分别是区块链1.0,区块链2.0,区块链3.0。
8.1 区块链1.0
区块链1.0是以比特币为代表的数字货币应用,为了解决货币和支付手段的去中心化,其场景包括支付、流通等货币职能。
8.2 区块链2.0
区块链2.0就是更宏观的对整个市场的去中心化,利用区块链技术来转换许多不同的资产而不仅仅是比特币,通过转让来创建不同资产单元的价值。最显著的标志是数字货币与智能合约相结合,对金融领域更广泛的场景和流程进行优化的应用。
让所有的金融交易都可以被改造成在区块链上使用,包括股票、私募股权、众筹、债券、对冲基金和所有类型的金融衍生品:期货、期权等。
8.3 区块链3.0
区块链3.0则超出金融领域,为各种行业提供去中心化解决方案,可用于实现全球范围内日趋自动化的物理资源和人力资产的分配,促进科学、健康、教育等领域的大规模协作。例如:自动化采购,智能化物联网应用,供应链自动化管理,虚拟资产兑换、转移。
9.区块链主流开源技术体系介绍
区块链开源技术种类繁多,这里就主流的开源技术体系进行简要的介绍。
9.1 比特币体系(BTC)
比特币(BitCoin)是最早也是全球最广泛使用和真正意义的去中心化区块链技术,因此他的开源技术体系非常值得参考。比特币区块链的核心技术框架采用C++语言开发,共识算法采用POW算法,工作量(挖矿)证明获得记账权,容错50%,实现全网记账。核心技术框架采用C++语言开发,公网TPS<7。
开源地址为:https://github.com/bitcoin/bitcoin
9.2 以太坊(ETH)
以太坊是一个图灵完备的区块链一站式开发平台,采用多种编程语言实现协议。基于以太坊平台之上的应用是智能合约,这是以太坊的核心。智能合约配合友好的界面和外加一些额外的小支持,可以让用户基于合约搭建各种千变万化的DApp应用,这样使得开发人员开发区块链应用的门槛大大降低。
底层核心技术框架采用C++,Go等语言开发,智能合约采用Solidity语言编写。公网TPS<35,未来有望达到2000TPS。
开源地址:https://github.com/ethereum/
9.3IBM HyperLedger fabric
IBMHyperLedger,又叫 fabric,是一个带有可插入各种功能模块架构的区块链实施方案,他的目标是打造成一个由全社会来共同维护的一个超级账本。 Fabric的主要框架核心开发语言是GO语言,系统目标是15个验证节点下最理想情况下可以有100KTPS的性能,更适合于联盟链。
开源地址:https://github.com/hyperledger/fabric
9.4 比特股(BitShare)
比特股(BitShares)是区块链历史上里程碑式的产品之一。它提供的BitUSD等锚定资产是虚拟币历史上的一个最重要变革之一,能够极大消除虚拟货币被人诟病的波动性大的问题。比特股采用的是DPos共识算法,公网TPS<3000。
比特股1.0开源地址:https://github.com/bytemaster/bitshares
比特股2.0开源地址:http://github.com/bitshares
9.5 瑞波(Ripple)
瑞波(Ripple)是一个开放的支付网络,是基于区块连的点到点全球支付网络。他的核心技术框架采用C++语言开发,公网TPS<1000。
开源地址:https://github.com/ripple/rippled
9.6 小蚁(NEO)
中国的世界级公链,NEO区块链通过将点对点网络、拜占庭容错、数字证书、智能合约、超导交易、跨链互操作协议等一系列技术相结合,让你快速、高效、安全、合法地管理你的智能资产。
NEO的底层是采用的C#,GO等语言,公网的TPS<1000。
开源地址:https://github.com/neo-project