Anthropicの次世代AIモデル「Claude Mythos Preview」が示した驚異的なサイバー攻撃能力と、その力を悪用される前に防御へ役立てるための新たな枠組み「Project Glasswing」について解説します。
サイバー攻撃と防衛のパラダイムシフト
2026年4月7日、AI開発大手のAnthropicは、開発中の次世代AIモデル「Claude Mythos Preview」の存在を公表しました。このモデルはこれまでのAIと比べて極めて高度な知能を備えていますが、その副産物として「ソフトウェアの弱点を発見し、それを突く能力」においても常人を遥かに凌駕する性能を持っていることが分かりました。サイバー攻撃に特化して作られたモデルではないものの、結果として極めて強力な攻撃能力をも獲得してしまった形です。
同社の発表によれば、このAIはすでに、広く使われている基本ソフトであるLinuxカーネルやOpenBSDに潜んでいた重大な欠陥を、人間の介入なしに自律的に発見しています。中には27年間にわたって誰にも気づかれなかった欠陥や、無数の自動テストをすり抜けてきた16年前のバグも含まれていました。さらに、ただ欠陥を見つけるだけにとどまらず、それを実際に攻撃に利用するためのプログラム(エクスプロイト)を72.4%という極めて高い成功率で安定して自動生成することにも成功しています。これは同社の従来型AIモデルである「Claude Opus 4.6」などを大きく突き放す圧倒的な数値です。
高度なAIを「非公開」とする決断
これほど優秀な能力を持つAIモデルは、社会を豊かにする一方で、悪意のある攻撃者の手に渡れば世界中のシステムを深刻な危機に晒してしまう「諸刃の剣」となります。そのためAnthropicは、安全性が担保できない現状においてはClaude Mythos Previewを一般公開せず、徹底した管理の下に置くという決断を下しました。
しかし、AI技術の進化スピードは凄まじく、いずれ誰もがこうした強力な能力を容易に手にする時代が到来する可能性が高まっています。Anthropicは、そのような未来が訪れる前に、AIの類まれな能力を先んじて防御目的で活用し、社会全体の防衛力を高めるための緊急の取り組みを開始しました。それが「Project Glasswing」です。
防御のための攻撃プロジェクト「Project Glasswing」
Project Glasswingは、世界中の重要なITインフラを根底から守るための共同プロジェクトです。Microsoft、Apple、Google、AWSといった主要なテクノロジー関連企業に加え、Linux Foundationなどのオープンソース管理組織を含む40以上の団体が参加を予定しています。
このプロジェクトの最大の狙いは、攻撃者に先んじてClaude Mythos Previewのような強力なAIを「防衛側」の組織に提供し、自社のソフトウェアやシステムの弱点を徹底的に洗い出させることです。Anthropicは参加組織に対して最大1億ドル(約159億円)相当のAI利用枠を提供し、さらにソフトウェアの安全性を推進する非営利団体にも多額の資金援助を行うと発表しました。強力な攻撃手法を悪用される前に、自らの手で安全性を高めるための実証実験が進められます。
新たなセキュリティの考え方
これまでのセキュリティ対策の多くは、攻撃者が実際に使った手口や、すでに公になっている弱点を後から塞いでいく、いわば後手のアプローチが中心を占めていました。しかし、Claude Mythos Previewの登場が示したのは、AI自身が未知の弱点を次々と探し出し、斬新な攻撃手法を自律的に編み出してしまう現実です。
このような時代においてシステムを安全に保つためには、防御側もまたAIを積極的に活用し、自らを攻撃者の視点で厳しくハッキングして弱点を先回りして見つけるアプローチが必要不可欠です。高度な技術で作られた攻撃の矛には、同じく高度な技術で鍛えられた防衛の盾で対抗する仕組みが求められます。
今回明らかになった脅威と対策の大規模な動きは、システムを守るための技術と戦略が全く新しいフェーズに突入したことを示しています。ソフトウェアの安全性を確保するための基準は、これから急速にAIを前提とした形へとアップデートされていくはずです。
用語解説
Anthropic
安全で信頼できる人工知能の開発を目的として設立されたAI研究・開発企業。対話型AI「Claude」シリーズの提供元。Claude Mythos Preview
Anthropicが開発した次世代のフロンティアAIモデル。その極めて高度な知能ゆえに、結果としてサイバー攻撃への悪用リスクが高まっており、現在は非公開で防衛目的の検証にのみ用いられている。脆弱性(ぜいじゃくせい)
ソフトウェアやシステムの設計ミス、プログラムの記述ミスなどによって生じるセキュリティ上の弱点。エクスプロイト
発見された脆弱性を突いて、システムの乗っ取りや情報の窃取といった実際の攻撃を行うためのプログラムや手口のこと。Project Glasswing
Anthropicが主導し、MicrosoftやAppleなどの主要企業・組織と連携して、AIを用いて重要なソフトウェアの脆弱性を先回りして修正するための防衛プロジェクト。オープンソース
プログラムの設計図(ソースコード)が一般に公開され、誰でも自由に調査や改良ができるソフトウェアの形態。Linuxなどもこれに該当する。
出典・参考情報
- Project Glasswing: Securing critical software for the AI era
Anthropic公式によるProject Glasswingの発表詳細。プロジェクトの目的、1億ドルのクレジット提供、参加企業(AWS, Apple, Google, Microsoft等)、オープンソース組織への資金支援に関する一次情報。 - Claude Mythos Preview – Anthropic
Anthropic公式によるClaude Mythos Previewの技術詳細と評価。OpenBSDやLinuxカーネル等における数十年単位の未知の脆弱性(ゼロデイ脆弱性)の発見実例と、一般公開を控えた経緯に関する一時情報。
技術とノウハウでデジタルシフトをサポート
中小企業の頼れるパートナー
執筆者: 綾部 一雄(株式会社クロスディーズ 代表取締役)
ネットワーク維持管理、システム開発、ベンダー調整のスペシャリスト。前職では、600名以上の介護事業所で、介護事業用ソフトの導入や契約の電子化、テレワークシステムの導入等に幅広くに携わる。2021年より、株式会社佐々木総研にて業務効率化のためのロボットや最新技術を活用した開発を行っている。
