木星链 木星链
Ctrl+D收藏木星链

以太坊:以太坊智能合约逆向分析与实战:(5)深入EVM之合约的部署与调用

作者:

时间:1900/1/1 0:00:00

当我们部署和调用合约的时候,EVM都在做些什么?

如果你开发过以太坊智能合约,想必你应该熟悉这样的操作(此处以remix为例):

编写solidity代码->编译->部署->交互。合约的编写与部署似乎并不是一件很麻烦的操作:编写阶段就不说了,Solidity语言大家都应该会;到了编译阶段,本地的solc编译器会把Solidity代码编译成字节码;而在部署阶段,部署者通过发起一笔特殊交易calldata带上编译后的字节码,等交易上链之后,就完成了合约的部署;而合约交互,就是call合约里的某个函数,等待函数的响应和返回,一切就是这样的简单。

但是正如开车一样,当你踩住油门后,车辆开始前进。然而这看似简单的操作背后是汽油爆燃、活塞往复、数百个齿轮啮合传动、轮胎与地面滚动摩擦的复杂行为。部署和调用合约也是如此,它涉及到EVM的堆栈操作,内存读写,存储访问等一系列底层操作。当部署合约时,EVM把收到的calldata翻译成操作指令,把它们按照给定的长度和参数读入内存;当调用合约时,EVM又根据收到的calldata,通过函数选择器来确定调用哪一段代码,并返回数值。如果只讲理论未免过于枯燥,为了便于讲解,我们这次用ethernaut的一道题目作为例子,详细了解EVM是如何部署和运行合约的,以及如何充当人肉编译器,徒手编写智能合约。

以太坊Layer2上总锁仓量为98.50亿美元:金色财经报道,L2BEAT数据显示,截至目前,以太坊Layer2上总锁仓量为98.50亿美元,近7日涨10.37%。其中锁仓量最高的为扩容方案Arbitrum One,约59.09亿美元,占比59.99%,其次是Optimism,锁仓量23.21亿美元,占比23.56%。[2023/6/26 21:59:41]

这个题目是这样的:我们需要部署一个合约,当我们调用合约**whatIsTheMeaningOfLife()**函数的时候,它需要返回一个数字“42”。看起来很简单对吧?我们分分钟编写完毕:

慢着,题目后面还有个小小的附加要求:“所部署的合约大小不超过10个操作码”。好吧,这个要求的确够“小”,要知道连合约头部的“函数选择器”都不止10个操作码好吧?可是“函数选择器”是什么,为什么会出现在合约里面呢?带着你的疑问,继续向下看。

我们通过./solc--asm--bintarget.sol来看看这个合约的最终编译结果:

以太坊单日销毁量连续11日低于3000ETH:金色财经消息,据欧科云链链上大师数据显示,当前以太坊销毁量为236.3万ETH,近11天ETH单日销毁量持续低于3000ETH。近1小时,销毁量前三的协议分别为OpenSea、Uniswap V3及Tether。[2022/5/26 3:43:20]

608060405234801561001057600080fd5b5060b68061001f6000396000f3fe6080604052348015600f57600080fd5b506004361060285760003560e01c8063650500c114602d575b600080fd5b60336047565b604051603e91906067565b60405180910390f35b6000602a905090565b6000819050919050565b6061816050565b82525050565b6000602082019050607a6000830184605a565b9291505056fea26469706673582212206ef8c7b5177952a701b3b46b69cb3ec296f4c54c946692e8ec901f5e43c1e78a64736f6c63430008110033

这么一大坨十六进制数据,就是上述Solidity程序编译之后的字节码。当我们部署合约时,把这一堆data发给以太坊节点,等广播完成后,合约就部署完毕了。这是solc编译器编译Solidity程序得到的代码,看似杂乱无章的的数据,其实都是和opcodes一一对应的。我们来一段一段地看这些代码:

Glassnode:以太坊未平仓永续期货合约7日移动均值达78亿美元创新高:金色财经报道,据Glassnode最新数据显示,以太坊的未平仓永续期货合约7日移动均值已经超过了前高,达到了78亿美元。[2021/9/10 23:14:54]

合约部署代码:

608060405234801561001057600080fd5b5060b68061001f6000396000f3fe

合约运行代码:

6080604052348015600f57600080fd5b506004361060285760003560e01c8063650500c114602d575b600080fd5b60336047565b604051603e91906067565b60405180910390f35b6000602a905090565b6000819050919050565b6061816050565b82525050565b6000602082019050607a6000830184605a565b9291505056fe

auxdata:

a26469706673582212206ef8c7b5177952a701b3b46b69cb3ec296f4c54c946692e8ec901f5e43c1e78a64736f6c63430008110033

BitMEX Research:交易所运行自己的以太坊节点,但无法与Infura等第三方协调则会暂停服务:推特网友Mr Cat刚刚向赵长鹏提问称,你不是在运行自己的ETH节点吗?赵长鹏回复道,是的,但不确定这是否会成为孤链。BitMEX Research对此回复称,交易所可能确实运行自己的以太坊节点,但如果本地链无法与Infura等第三方提供商协调,则会暂停一些服务,等待调查。

今日早前消息,Infura以太坊API服务中断,多家加交易所及钱包服务疑似受到影响。[2020/11/11 12:19:40]

我们先简单地把这堆代码分为合约的部署代码、运行代码、auxdata三部分,如何理解这三种代码呢?我觉得可以理解为向太空发射卫星:“部署代码”就是运载火箭,而“运行代码”就是卫星。运载火箭只在发射卫星时才起到作用,一旦卫星进入轨道,火箭就废弃了,只留下卫星在太空中与地球通信。部署合约也是如此,在部署合约时,部署代码把一些初始化工作作完之后,就把合约的运行代码送入EVM,只留下运行代码在链上与用户进行交互。

那么言归正传,我们题目要求我们合约运行代码的opcedes不超过10条,那么,这段代码对应的opcodes是多少条呢?答:71条。

那么问题来了,如何把71条opcodes精简到10条以内呢?这就需要我们对EVM运行智能合约的方式有着一定的了解。如果不了解也没关系,拿起你手边的EVM指令集,我们一起来看看吧:

2018以太坊技术及应用大会定于6月3日至4日在北京召开:据中新网从主办方获悉,2018以太坊技术及应用大会定于6月3日至4日在北京召开,大会将吸引包括2014年IT软件类世界技术奖获奖者Vitalik Buterin在内的海内外技术开发者参会。大会还将发布中国以太坊开发者大调查报告,探访以太坊开发现状及问题。[2018/5/22]

首先我们要知道,EVM执行代码时是按照自上而下的顺序执行的,代码中没有其他入口点,始终从顶部(也就是第一行opcode)开始执行。。也就是说,当我们部署合约时,EVM会从第一个bytecode开始读起。

所以我们看字节码最前面的部分,也就是它的部署代码:608060405234801561001057600080fd5b5060b68061001f6000396000f3fe

对照EVM指令,我们可以识别出这段代码的含义:

然后我们看合约的运行代码:

6080604052348015600f57600080fd5b506004361060285760003560e01c8063650500c114602d575b600080fd5b60336047565b604051603e91906067565b60405180910390f35b6000602a905090565b6000819050919050565b6061816050565b82525050565b6000602082019050607a6000830184605a565b9291505056fe

综合以上可以发现,合约的运行代码的架构是这样的:

初始化操作、函数选择器这些,是solc在编译Solidity程序的时候自动生成的。如果我们砍掉这些复杂的东西,直接把我们想要的核心功能编码上去,不就可以在10条以内opcodes实现既定功能了吗?

通过分析图4的whatIsTheMeaningOfLife()函数调用栈可以得知,让智能合约返回“42”(十六进制0x2a)的关键在于先用mstore指令将0x2a放入Memory,再用return指令将内存里的0x2a返回即可。至于那些函数名称和函数签名,只是高级语言的编译产物,直接用汇编实现的话,我们直接用这段代码读写内存,完全没有必要搞那些花里胡哨:

以上代码相当于构造了一个十分小的合约“运行代码”。前面我们说过,EVM执行代码时是按照自上而下的顺序执行的,代码中没有其他入口点,始终从顶部(也就是第一行opcode)开始执行。而且我们编写的代码并没有函数选择器,也就是说,当外部账户调用该它时,无论传递给它什么样的参数、什么样的函数签名,EVM都只会从它的处开始执行,老老实实地走到,然后return给我们一个0x20.

但这只是运行代码,还记得本文开头说的那三段字节码吗?是的,我们还差一个“运载火箭”,把这段运行代码给发射出去:

部署代码的结构基本没怎么变,之前已有解析,此处就不罗嗦了,唯一的区别是把复制到内存的长度由b6改为0a?:608060405234801561001057600080fd5b50600a8061001f6000396000f3fe

然后把他们拼接到一起,记得部署代码在前、运行代码在后,最后我们把这段代码发射出去就OK了:

你将得到一个超级小巧、只有10个字节、无论传递什么参数都只会返回?42?的“智能合约”

全文完。

关于作者:

https://twitter.com/0xNezha

来源:bress

标签:以太坊SOLODECODE以太坊币最新价格6月走势分析sol币为什么一直涨NodeseedsDecode Coin

火币交易所热门资讯
WEB:来看看Binance Labs最近投了什么

作者:KimmingBNBChain是日活跃用户最多的智能合约区块链之一,最近,币安宣布了第五批27家从其Web3加速器项目MVB(MostValuableBuilder)中脱颖而出的创业公司.

1900/1/1 0:00:00
以太坊:以太坊未来?年的破局之路 ? 模块化

Vitalik在其Endgame一文中,描绘了他认为的Ethereum终极形态,其中花费?量篇幅描绘了?个由Rollups和DA构建起来的新以太坊.

1900/1/1 0:00:00
元宇宙:A16z:虚拟社会、区块链和元宇宙

文章作者:ElenaBurger&A16z文章编译:Blockunicorn 1986年.

1900/1/1 0:00:00
MOS:Luna后稳定币百花齐放 Cosmos要成为新的DeFi大花园了吗?

撰文:傅卓蕊Cosmos跨链生态系统如今和波卡系统可谓跨链的双峰,尤其近1-2年发展迅猛。近2021年10月,亚洲开发银行通过Cosmos技术分布式管理账本信息.

1900/1/1 0:00:00
区块链:金色观察 | 以太坊上逆转NFT和代币交易:ERC-20R和ERC-721R解读

文/KailiWang,斯坦福大学区块链交易的不可篡改性是把双刃剑。BAYC网络钓鱼、PolyNetwork攻击、Harmony桥、Ronin被盗,仅在2021年,就有140亿美元的加密货币被盗.

1900/1/1 0:00:00
以太坊:美国想通过法案建立加密世界的新SWIFT

美国国会的一个新稳定币法案打算在2年内禁止发行人创建由其他数字资产支持的稳定币,这意味着大多数数字资产将与美元直接挂钩.

1900/1/1 0:00:00