Nghiên cứu về Tác nhân Trí tuệ Nhân tạo và Hợp đồng Thông minh
Một nghiên cứu gần đây của MATS và Anthropic Fellows đã xác nhận rằng các tác nhân trí tuệ nhân tạo (AI) có khả năng khai thác lợi nhuận từ các lỗ hổng trong hợp đồng thông minh, thiết lập một “giới hạn thấp cụ thể” cho thiệt hại kinh tế. Sự gia tăng tự động hóa các nhiệm vụ của con người bằng AI đang đối mặt với một thách thức lớn: những tác nhân này có thể lợi dụng các lỗ hổng trong hợp đồng thông minh.
Tiêu chuẩn Khai thác Hợp đồng Thông minh
Nghiên cứu đã sử dụng tiêu chuẩn khai thác hợp đồng thông minh (SCONE-bench) để đo lường rủi ro này. Các mô hình như Claude Opus 4.5, Claude Sonnet 4.5 và GPT-5 đã được triển khai thành công để phát triển các khai thác mô phỏng có giá trị lên tới 4,6 triệu USD. SCONE-bench bao gồm 405 hợp đồng thông minh đã bị khai thác từ năm 2020 đến 2025.
Trong báo cáo nghiên cứu ngày 1 tháng 12, nhóm nghiên cứu cho biết sự thành công của các tác nhân AI trong việc phát triển các khai thác được thử nghiệm trên mô phỏng blockchain đã thiết lập “một giới hạn thấp cụ thể cho thiệt hại kinh tế mà những khả năng này có thể gây ra.”
Khả năng Tạo ra Khai thác Mới
Nghiên cứu còn thử nghiệm Sonnet 4.5 và GPT-5 trên 2.849 hợp đồng mới được triển khai mà không có lỗ hổng đã biết. Các tác nhân này đã chứng minh khả năng tạo ra các khai thác có lợi nhuận ngay cả trong môi trường mới: cả hai đã phát hiện hai lỗ hổng zero-day mới và sản xuất các khai thác có giá trị 3.694 USD. GPT-5 đã đạt được thành công này với chi phí API chỉ 3.476 USD.
Những Phát hiện Đáng lo Ngại
Kết quả này chứng minh khả năng kỹ thuật của việc khai thác tự động có lợi nhuận trong thực tế, nhấn mạnh nhu cầu cấp bách về các cơ chế phòng thủ do AI điều khiển. Phát hiện đáng lo ngại nhất là sự gia tăng đáng kể về hiệu suất: một kẻ tấn công hiện có thể thực hiện khoảng 3,4 lần số lượng khai thác thành công hơn với cùng ngân sách tính toán so với sáu tháng trước. Hơn nữa, chi phí token cho các khai thác thành công đã giảm tới 70%, khiến cho những tác nhân mạnh mẽ này trở nên rẻ hơn đáng kể để vận hành.
Jean Rausis, đồng sáng lập tại SMARDEX, cho rằng sự giảm chi phí này chủ yếu là do các vòng lặp tác nhân, cho phép các quy trình làm việc tự sửa chữa nhiều bước, cắt giảm lãng phí token trong quá trình phân tích hợp đồng.
Các Đề xuất và Kế hoạch Hành động
Ông cũng nhấn mạnh vai trò của kiến trúc mô hình được cải thiện: “Các cửa sổ ngữ cảnh lớn hơn và các công cụ bộ nhớ trong các mô hình như Claude Opus 4.5 và GPT-5 cho phép mô phỏng liên tục mà không bị lặp lại, tăng cường hiệu suất từ 15-100% trong các nhiệm vụ dài hạn.” Ông lưu ý rằng những cải tiến này không chỉ dừng lại ở việc phát hiện lỗ hổng thô (tăng tỷ lệ thành công trên SCONE-bench từ 2% lên 51%), mà còn tập trung vào việc tối ưu hóa thời gian chạy.
Khi nghiên cứu thiết lập một chi phí mô phỏng là 4,6 triệu USD, các chuyên gia lo ngại rằng chi phí kinh tế thực tế có thể cao hơn nhiều. Rausis ước tính rằng các rủi ro thực sự có thể cao gấp 10-100 lần, có thể đạt tới 50 triệu đến 500 triệu USD hoặc hơn cho mỗi khai thác lớn.
Ông cảnh báo rằng với sự mở rộng của AI, tổng mức độ tiếp xúc trong toàn ngành – tính đến đòn bẩy không được mô hình hóa và sự cố oracle – có thể đạt tới 10-20 tỷ USD hàng năm.
Bài báo của MATS và Anthropic Fellows kết luận với một cảnh báo: trong khi các hợp đồng thông minh có thể là mục tiêu ban đầu của làn sóng tấn công tự động này, phần mềm độc quyền có khả năng là mục tiêu tiếp theo khi các tác nhân cải thiện khả năng đảo ngược kỹ thuật. Quan trọng là, bài báo cũng nhắc nhở độc giả rằng cùng một tác nhân AI có thể được triển khai để phòng thủ nhằm vá các lỗ hổng.
Kế hoạch Hành động Đề xuất
Để giảm thiểu mối đe dọa tài chính hệ thống từ các cuộc tấn công DeFi dễ dàng tự động hóa, Rausis đề xuất một kế hoạch hành động ba bước cho các nhà hoạch định chính sách và cơ quan quản lý: giám sát AI, tiêu chuẩn kiểm toán mới và phối hợp toàn cầu.