Claude Mythos 破解了 73% 以往任何 AI 都無法解決的專家級網路安全任務

根據英國人工智慧安全研究所(AISI)的最新評估,Anthropic 的 Claude Mythos Preview 已成為首個完成完整模擬企業網路攻擊的 AI 模型。

該模型於 4 月 7 日宣布後數天發布的研究結果顯示,AI 網路攻擊能力已達到需要全球安全團隊立即關注的程度。

什麼是 Claude Mythos?

Anthropic 於 4 月 7 日發布了 Claude Mythos Preview 模型,但選擇不進行廣泛的公開發布。該團隊僅向安全研究公司授予有限訪問權限,以評估和準備應對其先進能力。

在 X 上關注我們,即時獲取最新消息

這項發展已開始引起科技界甚至政策圈的關注。根據路透社引述知情人士的報導,美國財政部長 Scott Bessent 和聯邦儲備委員會主席 Jerome Powell 與主要銀行執行長舉行緊急會議,就與該模型相關的潛在網路風險發出警告。

人工智慧安全研究所(AISI)是英國政府科學、創新與技術部內的研究機構,對 Anthropic 的 Claude Mythos Preview 進行了網路安全評估,以檢驗其網路安全能力。

首先是奪旗(CTF)評估,系統必須識別並利用漏洞以獲取隱藏的「旗標」。Mythos 在專家級任務中達到了 73% 的成功率。這些任務在 2025 年 4 月之前從未被任何模型解決過。

Claude Mythos 網路攻擊能力。來源:AISI

此外,AISI 建立了一個名為「The Last Ones」(TLO)的 32 步企業網路攻擊模擬。人類安全專業人員需要大約 20 小時才能完成。

Mythos Preview 在 10 次嘗試中有 3 次完成了整個模擬。平均而言,它完成了 32 個攻擊步驟中的 22 個。表現次佳的 Claude Opus 4.6 平均只完成了 16 個步驟。

Anthropic 自己的紅隊測試發現,當用戶明確指示時,Claude Mythos Preview 可以在所有主流作業系統和主流網路瀏覽器中檢測並利用零日漏洞。

AISI 指出,組織應優先考慮基礎網路安全措施。這些措施包括定期修補、嚴格的訪問控制、安全配置強化以及全面的日誌記錄。

訂閱我們的 YouTube 頻道,觀看領導者和記者提供的專業見解

文章 Claude Mythos 破解 73% 以前任何 AI 都無法解決的專家級網路任務首次發表於 BeInCrypto。

來源:https://beincrypto.com/claude-mythos-preview-cyber-capabilities-test/