上一篇我们讲了ABI中的参数含义 以太坊ABI介绍(一),但是只有函数定义也是不行的,我们还需要调用,当调用一个函数时也需要对该函数进行编码,这样EVM才能执行,那么以太坊是如何生成可供EVM调用的字节码的。
生成的字节码主要分两部分:函数选择器和参数编码
函数选择器
即函数编码,对函数名称+参数类型进行sha3(keccak256)哈希运算之后,取前4个字节
1、方法一:
安装pyethereum [https://github.com/ethereum/p...]
> from ethereum.utils import sha3
> sha3("set(uint256").hex()
'0x60fe47b16ed402aae66ca03d2bfc51478ee897c26a1158669c7058d5f24898f4'
> sha3("setA(uint256)")[0:4].hex()
'60fe47b1'
2、方法二:
打开Ganache,默认端口7545,然后再命令行执行以下命令
curl -X POST -i http://localhost:7545 --data '{
"jsonrpc":"2.0",
"method":"web3_sha3",
"params":["set(uint256)"]
}'
返回结果:
{
"jsonrpc": "2.0",
"result": "0x60fe47b16ed402aae66ca03d2bfc51478ee897c26a1158669c7058d5f24898f4"
}
3、方法三:
const Web3 = require('web3')
const web3 = new Web3()
console.log(web3.sha3('set(uint256)'))
# 0x60fe47b16ed402aae66ca03d2bfc51478ee897c26a1158669c7058d5f24898f4
取前四个字节(一个字节=2个16进制字符)即:0x60fe47b1
参数编码
由于函数编码占用了4个字节,所以参数编码从第五位开始
参数的编码根据类型的不同,编码方式也有所区别。主要分为固定类型和动态类型
1、固定类型
- uint<M>:M为integer类型代表M bits,0 < M <= 256 , M % 8 == 0,如uint32,uint8,uint256。
- int<M>:同上。同为从8到256位的无符号整数。
- uint和int:整型,分别是uint256和int256的别名。注意: 函数参数类型是uint,转sha3码时要变成uint256。
- address:地址,20个字节,160bits。
- bool:布尔类型,1个字节,true:1,false:0。高位补0
- bytes<M>:固定大小的字节数组,0<M<=32,byte都是bytes1的别名。
2、动态类型
- bytes:动态分配大小字节数组。不是一个值类型!
- string:动态大小UTF8编码的字符串,不是一个值类型!
- T[] 某个类型的不定长数组
- T[k] 某个类型的定长数组
编码规则
固定类型的编码就很简单,直接将参数值转成32字节长度的16进制即可。但是有区别的是:不足32bytes时,数字类型,如果是正数高位补0,如果是负数高位补1,布尔类型高位补0,字节类型、字符串类型在低位补全
动态类型的编码稍微复杂点,如果是固定长度就不需要计算偏移量,如果是不定长度就需要先计算偏移量,并在最后加上长度和具体值的编码,详细步骤下面会介绍
具体编码过程
介绍的例子和官方文档一样,如果理解有偏差可以查看源文档
pragma solidity ^0.4.16;
contract Foo {
function baz(uint32 x, bool y) public pure returns (bool r) { r = x > 32 || y; }
function bar(bytes3[2] memory) public pure {}
function f(uint, uint32[], bytes10, bytes) public pure {}
}
案例
案例一:
函数:baz(bytes3[2] memory)
调用:baz(69, true)
-
0xcdcd77c0
,在node中使用new Web3().sha3('baz(uint32,bool)')
生成
const Web3 = require('web3')
const web3 = new Web3()
console.log(web3.sha3('f(uint256,uint32[],bytes10,bytes)'))
-
0x0000000000000000000000000000000000000000000000000000000000000045
,十进制69,转成16进制为45,因为是正数,高位补0至32bytes -
0x0000000000000000000000000000000000000000000000000000000000000001
,bool类型,true=1
,false=0
,高位补0
所以最终字符串为:(换行显示是为了方便查看,实际是没有换行)
0xcdcd77c0
0x0000000000000000000000000000000000000000000000000000000000000045
0x0000000000000000000000000000000000000000000000000000000000000001
返回:该函数返回的是true
,output将会是
0x0000000000000000000000000000000000000000000000000000000000000000
案例二:
函数:bar(bytes3[2] memory)
调用:bar(["abc", "def"])
-
0xfce353f6
,在node中使用new Web3().sha3('bar(bytes3[2])')
生成 - 固定长度不需要计算偏移量
-
0x6162630000000000000000000000000000000000000000000000000000000000
,字符串abc
转成16进制后为616263
,低位补0,字符串转16进制可以使用这个工具 -
0x6465660000000000000000000000000000000000000000000000000000000000
,同上
所以最终字符串为:(换行显示是为了方便查看,实际是没有换行)
0xfce353f6
0x6162630000000000000000000000000000000000000000000000000000000000
0x6465660000000000000000000000000000000000000000000000000000000000
案例三:
函数:f(uint,uint32[],bytes10,bytes)
调用:f(0x123, [0x456, 0x789], "1234567890", "Hello, world!")
-
0x8be65246
,在node中使用f(uint256,uint32[],bytes10,bytes)
生成 -
0x0000000000000000000000000000000000000000000000000000000000000123
,0x123
对应的16进制,正数补全 -
0x0000000000000000000000000000000000000000000000000000000000000080
,动态类型,计算偏移量。这个的偏移量是指实际存储值的位置,由于这个函数有4个变量,那么实际存储值的位置就是第五个32bytes位置,也就是说偏移量等于4*32bytes=128
,转成16进制后就是对应的值 -
0x3132333435363738393000000000000000000000000000000000000000000000
,字符串1234567890
转成16进制后为31323334353637383930
,bytes类型,低位补全 -
0x00000000000000000000000000000000000000000000000000000000000000e0
,动态类型,计算偏移量,这个偏移量就等于参数长度4*32bytes
+前面的动态参数参数占有的长度(因为前面只有一个动态参数,所以这个长度就是1*32bytes+2*32byte
s,1*32bytes
是第一个动态参数长度所占的bytes数,2*32bytes
是因为该函数中的第一个动态参数有2个值),那么具体的值就是4*32bytes+(1*32bytes+2*32bytes)=7*32bytes=224
,转成16进制就是e0,高位补全就是对应的值 -
0x0000000000000000000000000000000000000000000000000000000000000002
,第一个动态参数的长度,长度为2 -
0x0000000000000000000000000000000000000000000000000000000000000456
,第一个动态参数中的第一个元素 -
0x0000000000000000000000000000000000000000000000000000000000000789
,第一个动态参数中的第二个元素 -
0x000000000000000000000000000000000000000000000000000000000000000d
,第二个动态参数的长度,长度为13 -
0x48656c6c6f2c20776f726c642100000000000000000000000000000000000000
,第二个动态参数的值编码
所以最终字符串为:(换行显示是为了方便查看,实际是没有换行)
0x8be65246
0000000000000000000000000000000000000000000000000000000000000123
0000000000000000000000000000000000000000000000000000000000000080
3132333435363738393000000000000000000000000000000000000000000000
00000000000000000000000000000000000000000000000000000000000000e0
0000000000000000000000000000000000000000000000000000000000000002
0000000000000000000000000000000000000000000000000000000000000456
0000000000000000000000000000000000000000000000000000000000000789
000000000000000000000000000000000000000000000000000000000000000d
48656c6c6f2c20776f726c642100000000000000000000000000000000000000
以上就是以太坊调用函数时生成字节码的完整过程了!
欢迎订阅「K叔区块链」 - 专注于区块链技术学习
博客地址: http://www.jouypub.com
简书主页: https://www.jianshu.com/u/756c9c8ae984
segmentfault主页: https://segmentfault.com/blog/jouypub
腾讯云主页: https://cloud.tencent.com/developer/column/72548