区块链 - 区块链基础知识

最新推荐文章于 2022-11-10 15:52:11 发布

gnimgnot

最新推荐文章于 2022-11-10 15:52:11 发布

阅读量2.6k

点赞数 1

分类专栏： BlockChain

BlockChain 专栏收录该内容

3 篇文章 2 订阅

订阅专栏

区块链入门

区块链支持的加密货币，不通过任何信任或监管机构的（如银行或政府）验证来每笔交易，不涉及中间商，依赖新式加密，使区块链中的数据是防篡改的匿名数据。区块链会被复制到对等网络中的每个节点，所以没有单一故障点，确保了这项技术的可用性和可靠性。

区块链工作原理

比特币区块链是世界上第一个区块链技术实例。所以，“区块链”经常被误解为与比特币密不可分。比特币区块链还推广了一种观念：即区块链是虚拟化银行账本的数据结构，通过跟踪借贷及加密手段，有效防止加密货币单位的双重支出。所以，“数字账本”和“双重支出”术语就与加密货币区块链关联起来。

从本质上讲，区块链是一种防篡改的数据结构。可以跟踪在拥有者之间传递的有价值的内容。这里所指的“内容”可以是任何一种数字资产，如数字币、Word 文档或 Microsoft Surface 平板电脑序列号。实际上，只要是用唯一数字区分的物品，就能在区块链上进行跟踪。区块链要求转让数字资产所有权，而不是复制或共享，解决了所谓的“双重支出”问题。区块链技术的有趣之处在于：不仅建立了协议和强制执行的交易规则，还能够让分布式网络中的各节点自我监督整个操作，而且这是在没有中央服务器或信任颁发机构的情况下完成的。

区块链的核心组成部分

比特币区块链网络是公用的，所以，任何人可以随时参与进来。不过新的区块链产品/服务（如Azure托管的区块链）可以配置为公用网络、专用网络或特权网络。
虽然区块链是分散的，但分散的含义需要进一步澄清。正如 Vitalik Buterin 所解释 (bit.ly/2tEUYyT)，“分散式区块链”是指它们“不仅在政治上是分散的（不受任何监管），在体系结构上也是分散的（无基础结构中心故障点），但它们在逻辑上并不是分散的（有一个共同商定的状态，并且系统就像一台计算机一样运转）”。分散化提供容错、攻击防御和勾结防御（稍后我将介绍工作量证明）。

要了解如何设计公用区块链，需要了解：

加密哈希
公钥加密 (PKC)
二叉哈希链（特别是 Merkle树）
共识算法

掌握此嵌套哈希链概念后，就会理解区块链技术的基本设计了。

加密哈希

虽然有许多单向加密哈希算法变体，但通常选用的是 SHA-256 (bit.ly/29kkpft)。这是一种单向哈希函数，接受最大为(2⁶⁴-1) / 8
个字节的消息，并返回 32 个字节的哈希值（64 个十六进制字符），十进制数值范围在 0 到 1.16 * 10⁷⁷之间。
调整字符串中的任何字符，并重新计算 SHA-256 哈希值，就可以生成全新的哈希值。（若要试验，可以访问 onlinemd5.com，把文件或文本校验和类型设置为 SHA-256。）

如果输入相同，SHA-256 算法始终生成相同的定长输出。对于区块链技术，使用 SHA-256 加密哈希的价值在于：生成的值是唯一的，可同时用作数字指纹与校验和。此外，（作为惯例）单向哈希函数不能进行解码。以我名字的 SHA-256 值为例：
66BAC2902FA7F9B2FB17CC40AEF13EB6FD14696E729B8C09EA57C748FDC35580。这是哈希值，所以实际上无法使用算法反向推出我的名字。（有一种黑客技术是利用彩虹表，其中列出了已计算出的常见字符串（常用密码）哈希值，但这也不是通过算法来反向推出哈希。为了抵御此类攻击，惯例做法是通过附加随机字符串（称为“加密盐”值），修饰要哈希处理的字符串。）

如果没有 SHA-256 生成器可用，请参下面的表，它表明不同长度的字符串始终生成 64 位十六进制哈希值，以及对任何字符串稍作更改就会导致结果完全不同。

输入字符串	SHA-256 哈希值
m	62C66A7A5DD70C3146618063C344E531E6D4B59E379808443CE962B3ABD63C5A
M	08F271887CE94707DA822D5263BAE19D5519CB3614E0DAEDC4C7CE5DAB7473F1
M1	2D214CA69B86C255BE416D42CCA977A59B34A7492873105522C35015FAB806F0
M2	0892A10ECE1F933EE98F5D554601B28F8437801D1AA1B77799E4035DDCB6950C

有时，哈希值会进行双重哈希处理。也就是说，通过使用第二轮 SHA-256 算法，再次对第一个哈希值进行哈希处理。如果上表中的值进行双重哈希处理，最终会生成下表中的结果。

输入字符串	SHA-256 哈希值
m	A5FCE7E78734EC317F83F9019C80FFAF2508689B06EFA02191495A7D21FECE9A
M	6F6DCF58526B0D29EE664A708A939B7CDAC124A6A8569FCACE46FEAD38868E2E
M1	6C5D08BE9FFBBABD24B5F19AFFE6590FD402D347A50B519A59D40E15DCC0A6CB
M2	B2307311CC5877D5A581EDC821F3BFD5F99EB4E3B1D1B4009D9545BCF07E2E1A

公钥加密

区块链的主要功能之一是：跟踪数字资产的所有权。相关数字资产可能一文不值，也可能价值数百万美元。因此，所有权测试必须确保拥有者是无法冒充的。为了在数字领域进行此类测试，区块链利用的是 PKC，以便拥有者能够对资产进行数字签名，以证明所有权和授权资产转让。与使用一个私钥加密和解密消息的对称密钥加密不同，PKC 使用非对称密钥加密。

由于数字资产所有权的精确验证算法对于区块链至关重要，因此它们采用的是依赖椭圆曲线数字签名算法 (ECDSA) 的高安全系数公钥/私钥对生成策略。ECDSA 的优点在于，它创建的密钥虽然长度较短，但加密安全系数高于常用算法数字签名授权 (DSA) 生成的相同长度密钥。只要需要，用户就可以用软件程序生成加密密钥对。用户必须保留私钥备份，因为必须使用此密钥，才能转让或利用在区块链中存储的数字资产的价值。如果只有权访问私钥/公钥对中的私钥，可以重新生成公钥，因为这两个密钥之间存在一种数学关系。不过，无法通过公钥生成私钥。也就是说，如果只备份一个密钥，请务必备份私钥！

通常采用上述两种方式之一来使用这些密钥：
第一个用例（下图）是：希望有人向你发送只有你才能打开的加密消息。为此，请向对方提供你的公钥，让其使用此公钥加密文档，具体是通过软件程序加密算法，并生成加密文本（即加密版消息）。然后，对方就会向你只发送已加密文本。由于对方使用的是公钥来加密文档，因此必须使用正确配对的私钥才能解密文档。

图注：希望有人向你发送只有你才能打开的加密文档/消息时使用 PKC

第二个用例（下图）是：希望加密消息并且证明消息确实由你发送。为此，得使用私钥加密文本。然后，将此加密文本发送给其他人。对方会使用你的公钥来解密文本。由于只有你的公钥才能解密文本，因此收件人可以认为文本是用你的私钥加密的。也就是说，除非私钥被盗用，否则文本就是由你发送的。

图注：希望向其他人发送加密文档/消息并证明它确实由你发送时使用 PKC

第三个用例是使用 PKC 通过数字签名流程来证明数字资产所有权。在此用例（下图）中，假设 Bill 已编写具有法律约束力的 Word 文档，他需要通过电子邮件方式将文档发送给 Susan。Susan 希望确定她从 Bill 处收到的文档副本确实是由 Bill 发送，而且在途中尚未被篡改。Bill 先创建 Word 文档的 SHA-256 哈希，并将值记录为 H(W)。接下来，他使用自己的私钥对文档哈希进行加密，生成 Enc(H(W))，再向 Susan 发送 Word 文档（可视情况加密）和 Enc(H(W)) 值（这是 Bill 对文档 W 的数字签名）。

图注：使用 PKC 和加密哈希对文档/消息进行数字签名

Susan 通过她收到的 Word 文档副本重新计算 H(W) 值，再使用 Bill 的公匙解密 Enc(H(W)) 值（见下图）。如果 Susan 计算的哈希值等于解密的 H(W) 值，Susan 可以得出下列结论：Bill 对文档进行了签名，并且她收到的副本与 Bill 签名的文件完全相同。

图注：使用 PKC 和加密哈希验证文档/消息是否由预期方进行签名

使用哈希和 PKC，区块链维护了数字资产所有权的交易历史记录。交易数据对象相互链接，形成称为“哈希链”的数据结构。工作原理是，每个交易记录都会构成消息 (m)，此类消息先通过函数 (H) 进行哈希处理，再通过所有者私钥 (s) 进行签名。（惯例做法是，使用“secret”的首字母“s”表示私钥，以免与表示公钥的“p”混淆。）这就生成了签名 (sig)：

sig = signature(H(m), s)

在数字资产从一个所有者转让给另一个所有者后，新所有者会检查、验证它的数字签名并进行数字签名，再将它注册为哈希链上的新节点。尽管实现细节因区块链技术和版本差异很大，但对于所有这些技术和版本，基本概念是相同的。例如，如下图所示，Bill 是数字资产的所有者，他使用私钥发起向 Susan 转让数字资产。Susan 的交易记录使用 Bill 的公钥来验证他的签名。在此之后，Susan 使用公钥对数字资产进行签名，让 Susan 成为新所有者。这就会新建交易记录，即交易哈希链上的新链接。

图注：交易哈希链使用数字签名转让数字资产所有权；每个交易记录都保留有对哈希链中上一个交易的加密反向链接

此交易哈希链受加密保护，并且防篡改。对交易 0 的任何更改都会导致 Sig0 变化，要求更新在交易 1 中存储的哈希值，以及哈希链上的每个后续交易。

图中的交易对象包含数据。每个交易包含的数据因各个区块链实现而异。所以鉴于此，我已抽象化处理基础数据，因为要明白的要点是：哈希链是一种加密链接的交易链，即由上一个所有者的交易记录的哈希值链接起来。（在加密货币区块链中，每个交易对象都包含数字货币输入和输出列表，以及元数据（如时间戳和可选的交易费用）。这些加密货币输入和输出提供对财务账本进行精确建模所需的交易详情。）

Merkle 树

一些区块链使用另一种哈希链捆绑交易，即二叉哈希链或 Merkle 树。完整的 Merkle 树称为“二叉树结构”，因为它从根开始每个级别都有两个分支，如下图所示。

图注：Merkle 树是一种生成 Merkle 根哈希的二叉哈希树；此数据结构可以有效添加叶节点，并计算新 Merkle 根，而无需完全重新计算

Merkle 树的创建方式是：计算每个交易对象中数据的 SHA-256 哈希，以创建一系列叶子节点（比特币区块链对每个 Merkle 节点进行双重哈希处理；双重哈希处理有助于在 SHA-256 算法中发现漏洞的情况下，强化哈希结果中的加密值）。Merkle 树要求必须有偶数个叶子节点。也就是说，如果开始时为奇数，惯例做法是复制最后一个叶子节点。然后，每一对叶子节点一起进行哈希处理，生成新哈希值。在上图中，叶子 A 将交易 A 的哈希显示为： H_回答：；叶子 B 将交易 B 的哈希显示为 H_B 表示同一个数字。此模式继续应用于每个树的级别，一直应用到最终的根节点。根节点的哈希值是树中其他所有哈希和的加密哈希和。对任意叶子节点中数据的任何更改，都会导致重新计算的 Merkle 树根哈希值发生变化。

Merkle 二叉哈希树结构具有一些优点：例如，它可以轻松更新交易中的数据，并计算新 Merkle 的根哈希，而无需从头开始生成整个 Merkle 树。例如，如果（上图中突出显示的）交易 E 发生了变化，只需高效地为树中每个级别反向计算一次新哈希，一直计算到 Merkle 根即可。因此，先计算新叶哈希 H_E；再计算 H_EF ，依据为 H_E 和 H_F；再计算 H_EFGH ，依据为 H_EF和 H_GH；再计算新 Merkle 根哈希，依据为 H_ABCD 和 H_EFGH。更新 Merkle 根哈希只需进行 4 次计算，而从头开始生成 Merkle 树则需要进行 15 次计算！

生成区块链

若要生成区块链（见下图），必须以某种方式将包含交易的二叉哈希链数据对象提交到可供所有人使用的防篡改数据存储中（请注意，这是公用区块链，网络上的任何节点都可以对它执行读取或写入操作）。由于 Merkle 树结构包含交易且防篡改，因此似乎可以用作区块链。不过，存在几个问题。Bill 必须信任以代理身份处理他的数字资产转让请求的服务或网站，并且必须信任暂留哈希结构的服务器，才能将他的数字资产发送给 Susan。如果没有处理新交易的中央节点，或没有委托处理交易的中央集权机构，任何节点都可以处理 Bill 的挂起交易。具有超高处理能力的未授权节点或基准节点会纵容无效或欺诈性交易发生，这些交易可能会传播到可靠节点。为了解决此问题，网络可以尝试随机分配一个节点来处理 Bill 的交易，但这会再次集中控制权，并要求相信随机数生成器确实是在强制实现随机性。为了杜绝此问题，区块链使用了共识算法，如下所述。

图注：区块链由区块组成，这些区块继而包含交易哈希树；区块链上的区块反向链接到前面的区块，并通过工作量证明算法进行验证

共识算法：区块链技术通过遵循规定如何添加和维护区块的协议，杜绝了集中数据存储和信任授权问题。为此，它们强制执行区块链生成共识算法。共识算法有多种不同的种类，这里将介绍的是工作量证明 (PoW) 算法工作原理。

PoW 的依据是：网络上的一个节点需要通过产生的费用和解决计算难题所需的耗时，证明它的合理意图。为了让节点参与此类系统并遵守规则，网络提供激励（通常是金钱奖励）。也就是说，节点运算符向区块链添加区块时就会得到报酬。为了赢取金钱奖励，节点必须验证所有交易（以确保它们符合区块链的特定规则），再解决加密难题。

前面提到过，中央集权机构可以随机分配节点来处理一批新交易。这种方法需要使用中央随机数生成器，但它可能会有缺陷、遭黑客攻击或禁用。不过，为节点提供待解决的难题可以带来预期效果。无法预先确定第一个解决难题的节点，这就形成了网络节点的某种不可预测性。无需中央集权机构，这是区块链技术的关键创新之一。我还提到了区块链是分散式的，因此提供勾结防御。由于 PoW 在计算能力方面投入了时间和成本，因此任何一个节点或一组节点都几乎无法在网络上进行勾结，并且与其他对等节点相比，具有区块链生成优势。（存在“51% 攻击”风险，表明如果一组节点的计算能力最终达到 51%，就会出现勾结；但如果采用 PoW 共识算法，就不可能发生这种攻击。）

为了构造交易区块，节点需要获取在网络上存储的未处理交易，并生成 Merkle 树来计算 Merkle 根哈希。因此，候选区块包含交易列表和区块标头，其中标头包括 Merkle 根哈希值、当前时间戳和 PoW 难度级别（有时还附加有标头数据）。然后，它必须解决 PoW 难题，这涉及计算双重哈希的整个 256 位区块哈希值，再找到 32 位数字 nonce。可以将此数字与哈希值连接，生成 288 位数字的哈希，这样结果中就带有一定数量的前导零。此 32 位 nonce 介于 0 到 2³² (4,294,967,295) 之间。因此，惯常做法不是直接尝试猜测 nonce，而是从 nonce 0 开始，生成 SHA-256 哈希，并确定它是否有目标数量的前导零（也就是说，生成的哈希值小于目标值）；如果没有，节点会增加 nonce 值，并再次尝试。如果节点尝试了所有 nonce 值都未能解决难题，它会重新计算区块哈希值。这就保证生成不同的区块哈希值，因为区块标头中的时间戳包含在区块哈希计算中。节点可以随时选择一批不同的挂起交易，以供添加到新区块中（或添加自上次检查起可能出现的新挂起交易），这会更改 Merkle 根哈希值，并会连同时间戳一起更改新计算出的区块哈希值。每次重新计算区块哈希时，节点都会再次遍历所有超过 40 亿个 nonce。

随着时间的推移，网络上的某节点将会解决加密难题。此时，它会将新区块添加到区块链副本末尾（每个节点维护一个区块链副本），再将新区块广播到网络上的其他所有节点，这样它们就可以更新自己的区块链副本了。如果节点广播新区块，其他节点不会简单地相信新区块是有效的，它们会通过验证区块向自己证明这一点。若要进行验证，节点只需通过计算与 nonce 值连接的区块 SHA-256 哈希，即可验证 PoW 难题解决方案，并验证生成哈希的结果是否包含区块 PoW 难度值所指定数量的前导零。

顺便提一句，在某些区块链上，协议会不断调整 PoW 难度值，以便按规定的时间间隔将新区块添加到区块链中。这种持续调整是必要的，因为节点在网络中不断出现和消失，导致节点的平均计算能力总是在变化中。请注意，在 PoW 中，向区块链添加区块是有激励的。因此，节点管理员通常会增强硬件，以竞争获取奖励。在比特币区块链上，难度值每 2016 个区块调整一次，这样区块就可以每区块 10 分钟的平均速率继续添加。

有时会出现分支。这是因为在大型网络中，新区块传播需要时间。在传播过程中可能会出现的情况是，另一个节点解决 PoW 难题，向区块链副本添加新区块，再在网络上广播区块链。接收节点始终都会向区块链副本添加有效区块，而且由于每个区块都以加密方式连接到上一区块，两个不同节点发布的两个新区块会在链末尾生成链接到同一个区块的分支。不过，没关系。随着时间的推移，节点会在协议认为的“最长链”末尾添加新区块。例如，对于给定分支，最长链可以定义为具有最新区块时间戳的链。随着时间的推移，一个分支会在长度方面占上风，已放弃（更短）分支中的区块会遭删除，同时它们的交易会返回到未处理交易池中。

总结

本文介绍了如何构造由分散式对等节点网络上的加密链接区块组成的公用区块链，每个链接区块都有自己的加密链接交易哈希链。介绍了区块链技术的基础知识，将重心尽量不放在任何单一实现上，而是放在它们共有的一些更为典型的技术特性上。如果希望进一步探索此主题，建议选择一种区块链技术（如比特币、以太坊或 Ripple），并尝试掌握它具体实现的详细信息。