前沿AI模型在智能合约漏洞利用中展现出人类水平的能力

2 周前
閱讀 4 分鐘
3 視圖

AI代理与智能合约漏洞

根据Anthropic周一发布的新数据,AI代理在过去五年中记录的主要区块链上的智能合约漏洞利用中,超过一半的表现与熟练的人类攻击者相匹配。Anthropic评估了包括Llama 3Sonnet 3.7Opus 4GPT-5DeepSeek V3在内的十个前沿模型,使用了405个历史智能合约漏洞的数据库。

攻击模拟与资金盗取

这些代理成功实施了207个攻击,总计模拟盗取资金达5.5亿美元。研究结果显示,自动化系统能够迅速利用漏洞并识别开发者尚未解决的新漏洞。这一新披露是Claude AI开发者的最新成果。

“AI已经在Wiz Code和Apiiro等应用程序安全管理工具中被使用,并且在标准的静态应用程序安全测试(SAST)和动态应用程序安全测试(DAST)扫描器中也有应用。” – David Schwed

漏洞的可获取性与攻击扩展

安全专家表示,这些结果证实了许多漏洞的可获取性。Schwed表示,报告中描述的基于模型的攻击将很容易扩展,因为许多漏洞已经通过公共漏洞和暴露(CVE)或审计报告公开,AI系统可以学习并轻松尝试针对现有智能合约的攻击。

他指出:“更简单的方法是找到一个已披露的漏洞,找到那些从该项目分叉的项目,然后尝试利用该漏洞,这可能尚未被修补。”

模型性能与漏洞收益

为了衡量当前能力,Anthropic将每个模型的总漏洞收益与其发布日期进行了对比,仅使用2025年3月后被利用的34个合约的数据。尽管总漏洞收益是一个不完美的指标,Anthropic强调它而非攻击成功率,因为攻击者关心的是AI代理能够提取多少资金,而不是他们发现的漏洞数量或难度。

测试与发现的缺陷

Anthropic在一个包含2,849个合约的零日数据集中测试了这些代理,这些合约来自于超过940万个在Binance Smart Chain上的合约。Claude Sonnet 4.5和GPT-5各自发现了两个未披露的缺陷,产生了3,694美元的模拟价值

Anthropic指出,所有测试均在模拟区块链的沙盒环境中进行,而非真实网络。其最强的模型Claude Opus 4.5利用了17个2025年3月后的漏洞,贡献了450万美元的总模拟价值

AI在智能合约中的应用

Schwed表示,实验中突显的问题“实际上只是业务逻辑缺陷”,并补充说,AI系统在给定结构和上下文时可以识别这些弱点。他说:“AI也可以在理解智能合约应如何运作的基础上,结合详细的提示,发现如何尝试规避逻辑检查。”

Anthropic表示,使代理能够利用智能合约的能力同样适用于其他类型的软件,并且成本的下降将缩短部署与利用之间的时间窗口。该公司呼吁开发者在其安全工作流程中采用自动化工具,以便防御性使用能够与攻击性使用同样快速进步。

前景与应对措施

尽管Anthropic发出了警告,Schwed表示前景并非完全消极。他指出:“我总是反对悲观的观点,并说通过适当的控制、严格的内部测试,以及实时监控和断路器,大多数问题都是可以避免的。”

他补充道:“善意的行为者也可以访问相同的代理。因此,如果恶意行为者能够找到漏洞,善意的行为者也能找到。我们必须以不同的方式思考和行动。”