木星链 木星链
Ctrl+D收藏木星链
首页 > 火币APP > 正文

GPT:火爆出圈的最强 AI GPT 是否可用于合约安全审计?

作者:

时间:1900/1/1 0:00:00

前言

近期 ChatGPT 爆火,其对传统文字工作的效率提高及总结能力让使用者惊艳。紧随其后 CodeGPT 这样基于 GPT 的插件出现,也充分体现了其对代码编写效率的提高。而最新 GPT-4 的发布,是否可以应用到对区块链 、Solidity 智能合约的审计中呢?

基于这样的疑问,我们进行了多种可行性测试。

测试使用的对比模型对象:GPT-3.5(Web), GPT-3.5-turbo-0301, GPT-4(Web)。

代码片段使用 Prompt:Help me discover vulnerabilities in this Solidity smart contract.

漏洞代码片段的检测对比

在此部分,我们分三次测试,使用历史上常见的漏洞代码作为测试一和测试二的用例,来验证其对基础漏洞的检测能力,测试三中使用中等难度的漏洞代码作为测试用例。

测试一

用例:《智能合约安全审计入门篇 —— Phishing with tx.origin》

漏洞代码:

冉小波:算法交易诞生的流动性挖矿推动整个DeFi进入火爆阶段:9月4日消息,NULS联合发起人冉小波在做客《HyperPay焦点》栏目时提及:DeFi大热,资金都倾向于玩DeFi,反而应该是其他公链的一个挑战。所以公链也需要一些结合DeFi的一些创新的玩法了,不然大部分的资金和流量可能都会流转到一些毫无实际意义项目的流动性挖矿中。这一点相信其他的公链团队应该也感触颇深。DeFi的分支有很多,各家公链也都有在做一些探索,总的来看,推动整个DeFi进入火爆阶段的是算法交易诞生的流动性挖矿。近期大热的项目基本上都是一些新的项目,通过流动性挖矿来进行筹码的分配,以非常高的收益率来进行高通胀的Token分配,从而吸引大量的资金短时间内快速加入。[2020/9/4]

(1)对 GPT 进行提问:

(2)GPT-3.5(Web) answer

彭博社:8月加密市场因DeFi火爆增加超500种新代币:由于DeFi热潮涌动,2020年8月加密货币市场已经增加超500种新代币,或导致加密泡沫再次变得越来越大。在投机欲望激增的推动下,猪排(Porkchop)、Davecoin、意面(PASTA)、寿司(Sushiswap)Newtonium等新代币纷纷登场,许多项目没有实际效用,但投资者已经投入数十亿美元。根据DeFi市场数据提供商DeFi Pulse数据显示,截至9月2日,用户向所有DeFi应用程序投入的资金超过94.6亿美元。(彭博社)[2020/9/2]

(3)GPT-3.5-turbo-0301 answer

(4)GPT-4(Web) answer

INT chain主链全球公测,答题送20万INT糖果火爆进行中:为庆祝INT chain主链进行全球公测,连续多场赠送糖果活动正在进行中,用户进入INT官方社群即可进行参与。INT chain是一个基于物联网区块链的项目,目标是要做一条可以中继不同的物联网的公链,形成边缘计算网络,有效流通资源,加快物联网普及进度。大幅降低物联网区块链应用的开发难度,致力于使物联网区块链内化成如同 TCP/IP 一样的物联网基础架构。INT将围绕工业制造、无人驾驶、物联网+区块链避开交通堵塞、公共技术设施和智能城市等应用场景发力。[2018/5/10]

可以看到结果:3 个测试版本都发现了关键的 tx.origin 相关问题。

测试二

用例:《智能合约安全审计入门篇 —— 溢出漏洞》

(1)对 GPT 进行提问:

“区块链大爷”火爆2018全球区块链精英峰会会场:据火讯财经报道称,4月28日,在2018全球区块链精英峰会会场外,一个头发花白的大爷吸引了很多人的注意,大爷手持宣传牌,上面写着“全球首个保洁链-Clean Chain,去中介化的保洁服务与管理”,同时发布需求“求技术合伙人!求交易所联系方式!”在宣传语中还表达了保洁行业是人类刚需,与区块链技术相结合势不可挡的强烈意愿。现场很多人称其为“区块链大爷”。[2018/4/28]

可以看到 GPT-3.5(Web)、GPT-3.5-turbo-0301 都发现了关键的 Overflow 漏洞,出乎意料的是 GPT-4(Web) 居然没有相关提示。

测试三

用例:《空手套白狼 —— Popsicle 被黑分析》

区块链私募火爆 机构正在入场:近日,区块链项目私募的火热再次吸引了不少投资者的关注,而在今日,多位圈内大咖推出了门槛为500ETH的私募投资群,并表示入群者可以拿到市面上拿不到的私募额度。同时,郭宏才在微博表示有机构正在入场,网友认为,这是在花式割韭菜,不过也有人认为,这可能意味着大资金会进入场内。 ?[2018/1/2]

对比结果,我们可以看到 3 个版本都未发现关键的漏洞点。

代码片段的检测总结

可以看到 GPT 模型对简单的漏洞代码块的检测能力还是不错的,但是对稍微复杂一点的漏洞代码暂时还无法检测,并且在测试中可以看到 GPT-4(Web) 的整体上下文可读性很高,输出格式清晰、舒服,但是其对代码的审计能力暂时没有远超 GPT-3.5(Web)、GPT-3.5-turbo-0301,甚至在部分测试中由于 Transformer 输出存在一定的不确定性反而导致 GPT-4(Web) 遗漏了一些关键问题。

为了更加契合普通项目方在合约审计中的简单操作需求,这里我们提高些难度,针对代码量大的合约进行全量导入上下文,让 GPT-4 模型进行审计(GPT-3 对上下文的字符总数限制更小这里就不做测试)。

用例:《千万美元被盗 —— DeFi 平台 MonoX Finance 被黑分析》

整份合约分批输入,在对话最后提出检测漏洞请求

这里使用 Prompt:

Here is a solidity smart contract 

Contract code

The above is the complete code,help me discover vulnerabilities in this smart contract.

可以看到,GPT-4 虽然在 OpenAI 公布的信息中其单次输入字符总数已经是当前最高,但还是会由于文本超长导致在最后提问时 GPT 会上下文缺失而只识别到部分内容,所以这样对大型合约而言就无法进行完整的上下文审计。

拆封整份合约,分批输入分批检测

对话 1:

Help me discover vulnerabilities in this solidity smart contract.

分段内容 1

对话 2:

分段内容 2

对话 3:

分段内容 3

(1)优点

GPT 对合约代码中基础的简单的漏洞具备部分检测能力,并且在检测出漏洞后会以很高的可读性来解释漏洞问题,这样的特性比较适合为初级合约审计工作者前期训练提供快速指导和简单答疑。

(2)存在的问题

a. 每次生成内容波动

GPT 对每次对话的输出存在一定的波动,可以通过 API 接口参数进行调整,但是依旧不是恒定的输出,虽然这样的波动性对语言对话来说是好的方式,大大提高了对话给人的真实感。但是这对代码分析类的工作来说是一个不好的问题。因为为了覆盖 AI 可能告知我的多种漏洞回答,我需要多次请求同一问题并进行对比筛选,这无形中又提高了工作量,违背了 AI 辅助人类提高效率的基准目标。

例如这里再次运行 "漏洞代码片段的检测对比测试二(其中简单改变函数名后再次生成):

可以看到其输出结果比之前测试又多了一些额外内容。

b. 漏洞分析能力依旧有很大的提高空间

对稍微复杂的漏洞进行检测即会发现当前的(2024.3.16)训练模型不能正确的分析并找到相关关键漏洞点。

GPT 辅助合约审计的可行性和潜力分析

虽然当前来看 GPT 对合约漏洞的分析及挖掘能力还处于相对较弱的状态,但它对普通漏洞小代码块的分析并生成报告文本的能力依旧让使用者兴奋,在可预见的未来几年伴随这 GPT 及其他 AI 模型的训练开发,相信对大型复杂合约的更快速,更智能,更全面的辅助审计一定会实现。当科技发展可指数级提高人工的效率时就会发生质变,我们非常期待 AI 对区块链安全的助力,我们会持续关注新 AI 产品对区块链安全的影响。最后可见的将来我们必将与 AI 在一定程度上进行融合,愿 AI 和区块链与你同在。

慢雾科技

个人专栏

阅读更多

金色财经 善欧巴

金色早8点

白话区块链

Odaily星球日报

MarsBit

欧科云链

深潮TechFlow

Arcane Labs

BTCStudy

标签:GPT区块链DEFIDEF人工智能chatGPT区块链技术defi币圈defi community

火币APP热门资讯
ARB:ARB空投在即 如何提前批准合约、更快Claim并交易

ARB空投马上就可以领取了。如何更快地Claim?如何进行LP?如何更快地买入和卖出? 本文是一份快速指南.

1900/1/1 0:00:00
WOR:零知识机器学习 (ZKML) :ZK与AI将会碰撞出怎样的火花?

原文标题:《AN INTRODUCTION TO ZERO-KNOWLEDGE MACHINE LEARNING (ZKML)》原文来源:Worldcoin原文编译:深潮 TechFlowZer.

1900/1/1 0:00:00
TOK:NFT 市场的下一个新叙事:Open Loyalty

作者 : starzq.ethTwitter : starzqethPFP 之后,NFT 市场的下一个新叙事是什么?大家都在呼唤更有实用价值的 NFT.

1900/1/1 0:00:00
元宇宙:连Meta都在搞AI 谁还记得元宇宙?

在ChatGPT引爆的AI浪潮下,曾被众多科技公司给予厚望的元宇宙,逐步成为了被抛弃的“试错”产物.

1900/1/1 0:00:00
DAO:探讨DAO治理中隐私投票的利与弊

DAO治理中隐私投票是蜜糖还是砒霜?DAO 是加密货币带给世界的新治理结构,它旨在为个人和团队协调和组织方式带来更多自主权.

1900/1/1 0:00:00
BSP:Arbitrum Nova新手指南

本文来自Bankless,由 Odaily星球日报译者 Katie 辜编译。 随着 ARB 空投在即,人们开始对 Arbitrum 生态系统密切关注.

1900/1/1 0:00:00