AIが脆弱性を見つけすぎる？Anthropicの「Claude Mythos」と制限の裏側

※下記内容は、2026年5月29日時点で筆者がインターネット上の情報を調査・整理したものです。情報が錯綜している段階のため、一部誤りや未確定情報が含まれる可能性があります。間違いや追加情報などございましたら、ご指摘いただけますと幸いです。

こんにちは、オレンジソフトウェアの藤田です。

弊社は大阪の本町と緑地公園にオフィスを構え、WEBシステム開発やSEO対策、サーバー管理などを行っている会社です。

日々の業務において、お客様の大切なシステムやデータを守るセキュリティ対策や、新たな脆弱性への速やかな対応は決して切り離すことができません。

常に最新の技術動向にアンテナを張る中で、今まさに私たちの常識を覆すような変化が起きようとしています。

ここ最近、サイバーセキュリティ界隈を大きく揺るがしているニュースがあります。

それが、Anthropicの最新AIモデル 「Claude Mythos（ミュトス）」 と、それを用いた脆弱性発見プロジェクト 「Project Glasswing（プロジェクト・グラスウィング）」 の動向です。

なんと、AIが世界中のソフトウェアから 1万件以上の重大な脆弱性 を瞬時に見つけてしまい、現在その利用がGoogleをはじめとする約50社・組織に厳しく制限されているというのです。

私たちオレンジソフトウェアでも日々最新の情報を収集し、開発やサーバー管理に役立てています。

今回は、この驚きのニュースについて、非エンジニア向け、そしてエンジニア向けに分けて詳しく解説します。

【非エンジニア向け】泥棒より先に鍵の壊れやすさを見つけるAI

専門知識がなくてもわかるように、このニュースの凄さと怖さを例え話で解説します。

1. AIは「超優秀なセキュリティ監査官」

これまでは、人間の専門家が何日もかけて、ソフトウェアのプログラムに「ハッカーに悪用されそうな隙（脆弱性）」がないか探していました。

しかし、新しいAIにプログラムを読み込ませると、 人間が見落としていた危険な隙を、ほんの数秒で、しかも1万件以上も 見つけてしまいました。

2. なぜ「50社だけ」に制限して隠しているの？

これは 「悪用されたら世界が崩壊するレベルの爆弾」 だからです。

AIは「ここに隙があるよ」と教えるだけでなく、 「ここをこう突けば、このソフトを乗っ取れるよ」という攻撃の手順（実証コード）まで自動で作れてしまいます。 もしこのAIを誰でも使えるように一般公開したらどうなるでしょうか？

悪いハッカーたちが、世界中の銀行、飛行機の管制システム、スマホのアプリなどの弱点を一瞬で割り出し、サイバー攻撃を仕掛けてきます。

そのため、Googleや政府などの「信頼できる安全な50社」だけで厳重に管理し、ハッカーに先を越される前にこっそり直そうとしています。

3. Linux（リナックス）の連続発見について

Linuxとは、世界のインターネットサーバーやAndroidスマホなどの土台を支えている、最も重要なプログラムです。

今回、この土台（Linux）からも大量の危険な隙が見つかりました。

例えるなら、 「世界中の金庫の鍵が、実は最初から簡単に開けられる構造になっていた」 ことがAIによって次々と暴かれてしまった状態です。

この脆弱性については、いくつか記事をあげているので、参照していただけると嬉しいです。

【エンジニア向け】パッチ適用がボトルネック化するAI駆動型セキュリティ

ここからは、技術的な背景と具体的なデータを含めて詳しく解説します。

1. Project Glasswing と Claude Mythos Preview のスペック

2026年4月にAnthropicが始動した防衛プロジェクト「Project Glasswing」では、一般未公開のフロンティアモデル 「Claude Mythos Preview」 が投入されました。

驚異的な適合率（True Positive Rate）： オープンソース（OSS）1,000以上のプロジェクトをスキャンし、23,019件の候補を検出。そのうち高・重大（High/Critical）と判定された6,202件のうち、第三者機関が精査した結果、 90.6%が誤検知ではない「本物の脆弱性」 でした。
企業の検出事例： * Cloudflare： 自社コードから2,000件のバグ（うち400件がHigh/Critical）を検出。ノイズ（誤検知）の少なさは人間のテスターを上回ると報告。
- Mozilla： Firefox 150のテストにおいて、従来のClaude 4.6（Opus）と比較して 10倍以上のバグ検出率 を記録。
ゼロデイの自動概念実証（PoC）生成： 単なる静的解析（SAST）ではなく、自律的にExploit（攻撃コード）まで構成可能。一例として、数十億のデバイスで使われる暗号化ライブラリ wolfSSL において、証明書を偽装して銀行やメールを模したフィッシングサイトを完全に成立させるゼロデイ脆弱性（CVE-2026-5194、CVSS 9.1）を発見・実証しました。

2. なぜ50社制限なのか？ ──「防衛の非対称性」と政府の介入

当初、Anthropicはアクセス組織を120社へ拡大する予定でしたが、 ホワイトハウス（米政府）がこれをブロック しました。 AIモデルの発行・展開に政府が直接介入した初の事例です。

Remediation（修復）の限界： AIがバグを1秒で見つけても、OSSのメンテナや企業の開発者がコードをレビューし、パッチを書き、テストしてデプロイするには数日〜数ヶ月を要します。（1,596件のOSS脆弱性を報告したものの、現時点でアップストリームでパッチが当たったのは97件のみ）未修正の脆弱性リスト（バックログ）がAIによって無限に生成されるため、 一般公開するとディフェンダー側がトリアージで完全に窒息 します。
Compute（計算資源）の独占： 政府側は、国家の重要インフラ防衛のためのコンピュートリソースが、民間企業の無差別なスキャンによって枯渇することを懸念しています。

3. Linux等における脆弱性ラッシュの背景

Linux Foundationもこの50組織に含まれており、カーネルのコードベースに対する集中的なAI監査が行われています。

これまで発見が難しかった「複数コンポーネントの複雑な相互作用による競合状態（Race Condition）」や「メモリ安全性の不備」が、Mythosの高度な推論（Reasoning）とコードベースマッピング機能（Codebase-mapping harnesses）によって一網打尽にされているのが、ここ最近のCVE連続発行の裏側です。

結論：セキュリティのパラダイムシフト

実は私たちオレンジソフトウェアでも、過去にサーバーの脆弱性を突かれ、不正なマイニングソフトウェア（暗号資産を勝手に採掘するプログラム）を仕込まれてしまった苦い経験があります。

幸いにも、そのサーバーは開発・検証用のテスト環境だったため、個人情報や機密データなどは一切保持していませんでした。また、サーバーの構築段階でアクセス権限の分離やネットワーク制限といった多段防御（防御層を複数重ねる対策）を講じていたため、システムの全権限（root権限）を奪われるような最悪の事態は免れました。

しかし、この経験は私たちに「テスト環境であってもセキュリティ意識を絶対に疎かにしてはならない」という教訓を強く刻み込みました。そして、今回のような最新の脆弱性トレンドや情報を常にキャッチアップし、確認し続けることがいかに大切かを再認識するきっかけとなったのです。

サイバーセキュリティの根本にある「脆弱性を先に見つけた側が圧倒的に有利になる」という原理原則は、これからも変わりません。

攻撃者であれ防衛者であれ、未知の抜け穴（ゼロデイ）を握った側が主導権を握るという構図はそのままでs。

しかし、AIの登場によって変わったのは、その「発見に要する時間とコストの桁」です。

これまでは人間の高度な専門知識と膨大な時間を必要としていた脆弱性の探索が、AIによって「数秒、かつ数千件規模」で自動化される時代になりました。つまり、原理が変わったのではなく、発見の効率が爆発的に向上した結果、防衛側は「AIが超高速で叩き出す膨大なバグ報告に対し、人間の手によるパッチ検証や適用スピードが全く追いつかない」という、物理的な処理限界の壁に直面しています。

これからのセキュリティは、発見の技術を競うフェーズから、「AIによって見つけられた大量の脆弱性リスクに対し、いかに人間が的確にトリアージを行い、AIによる自動パッチ生成・適用（Auto-Remediation）などを組み合わせて防衛を間に合わせるか」という、純粋な「修復スピードの戦い」へとシフトしています。

オレンジソフトウェアでも多くのLinuxサーバーを管理・運用しており、今回のセキュリティトレンドは決して他人事ではありません。

過去の経験と教訓を胸に、今後もAI駆動型セキュリティの動向を注視し、迅速なパッチ適用と堅牢なシステム構築に努めてまいります。