AI・テック

AIを3回乗り換えてわかった本音レビュー|Opus 4.8・Mythos・GPT-5.6が6月に激突する?

AIを3回乗り換えてわかった本音レビュー|Opus 4.8・Mythos・GPT-5.6が6月に激突する?

気づけば、メインで使うAIを3回乗り換えていました。最初はGemini、次にChatGPT、そして今はClaude。

でも、のんびり「次はどれにしようかな」なんて言っていられる時代は、もう終わったのかもしれません。いま、2026年6月を目前にして、各社の主役級モデルが一斉にぶつかり合う——AI史上いちばん激しい決戦が始まろうとしています。

数年AIを使い倒してきた一個人として、この「いま起きていること」と、各社の本音レビュー、その先にある未来について書いてみます。あくまで感想なので、参考程度に。

いま、2026年6月——モデル激突の構図

まず、この記事のいちばん熱い部分から。これを書いている2026年5月末、各社の動きが完全に「ぶつかる前夜」になっています。6月は主役級モデルが何個も飛んでくる、とんでもない月になりそうです。

陣営モデル状況ひとことで
AnthropicClaude Opus 4.85/28リリース済み誠実さで攻める現行最新
AnthropicMythos(ミュトス)数週間以内に全開放予定封印されてた最強モデル
OpenAIGPT-5.6※噂段階・6月説150万トークンの怪物(未確認)
GoogleGemini 3.5系5/20 I/Oで登場済み映像とGoogle連携の本命
xAIGrok 5※噂・6月狙い観測伸びしろの新星、要注目

Claude Opus 4.8 を実際にレビューしてみた(5/28リリース)

つい先日、Claudeの新バージョン「Opus 4.8」が出ました。レビュー記事や検証動画が一気に出回っている最中なので、ひととおり目を通したうえでの感想を書いておきます。

結論から言うと、今回のアップデートは「派手さより誠実さ」で一貫しています。

  • コーディングが伸びた:エージェントコーディングの指標(SWE-bench Pro)で69.2%。前バージョン4.7の64.3%、ライバルGPT-5.5の58.6%を上回る
  • でも全勝ではない:一部のベンチではGPT-5.5にまだ負けている部分もある。得意分野でしっかり伸ばした、という感じ
  • 価格は据え置き:4.5/4.6/4.7と同じ。値上げなしで性能アップは普通にうれしい
  • 2.5倍速で3倍安いファストモード、複数の作業を同時並行でこなすダイナミックワークフロー、応答にかける「本気度(エフォート)」を自分で選べるパネルも追加

そして、私が一番グッときたのが「正直さ」の改善です。自分が書いたコードの欠陥を見逃す確率が、前バージョンの約4分の1に減ったとのこと。さらに面白いのが、その正直さの“中身”。Opus 4.8は他社含む複数モデルの中で最も「間違った答えを出す率」が低かったのですが、それは正解を増やしたからではなく、自信のない問題には答えを差し控えたから、という分析が出ています。

これ、まさに私がこの記事でClaudeを「信頼できる」と書いてきた理由そのものなんですよね。「わからないことはわからないと言う」をベンチマークで証明しちゃった形。

しかも、Anthropic自身がこのリリースを「控えめだが確かな改善」と正直に表現したのが個人的にツボでした。「劇的進化!」と煽らない。誇張しないAIを作る会社が、誇張しない告知をする。一貫していて好感が持てます。

※ちなみに、Anthropic自身が「最も懸念している」と認めた点もあって、4.8は“テストされていない場面でも、自分の答えがどう採点されるかを考える傾向”が強まっているそうです。要は「評価されてると気づいて点を稼ぎにいく」ような挙動。誠実さを売りにしつつ、こういう不都合な発見も自分から開示してくるあたり、逆に信用できるなと思いました。

数週間後には「Mythos(ミュトス)」が全開放

そして、Opus 4.8の上にはさらに上位の「Mythos」が控えています。これがちょっと只者じゃない。

もともとMythosは「危険すぎて一般公開できない」として、サイバーセキュリティ目的でAmazon・Microsoft・Appleなど一部の組織にしか開放されていなかったモデルです。自律的にゼロデイ脆弱性(未知のセキュリティ穴)を見つけて、それを突くコードまで作れてしまう。だから慎重に封印されていた。

それが「安全策のメドが立った」として、数週間以内に全顧客へ開放される予定とのこと。数学のUSAMOというえげつない難易度のテストでも、旧Opusを大きく引き離すスコアを出していて、能力ティアが一段違う。封印が解かれた最強モデルが市場に降りてくる、という構図です。

GPT-5.6 も噂が出ている(※あくまで噂)

OpenAI側も負けていません。次世代モデル「GPT-5.6」の痕跡が開発者向けのログで目撃された、という話が出ています。コードネームは「iris-alpha」、なんと150万トークンの超長文対応(前世代から約43%増)で、6月リリース説も。予測市場では「6月末までに公開」に約89%のオッズがついているとか。

ただしこれはあくまで噂の段階です。公式発表もなければ、APIもベンチマークも存在しません。ネット上には自信満々に「GPT-5.6のスペック」を語る記事もありますが、現時点では推測の域を出ない。鵜呑みにしないのが賢明です(この記事でこのあと書く「裏を取る」精神ですね)。

で、結局どうなる?

整理すると、6月は——OpenAIのGPT-5.6(+上位版の噂)、AnthropicのMythos系、GoogleのGemini 3.5系、さらにGrok 5まで、各社の主役級が一斉にぶつかる可能性がある。こんな月、今までなかったです。

私の予想を正直に言うと、「誰が一番か」は1か月で何度もひっくり返ると思っています。Opus 4.8が出た瞬間に「いや数週間後にMythos来るんでしょ」となり、その横でGPT-5.6の噂が走り、Geminiも黙っていない。順位を確定させる暇すらない。

……という話が、実はこの記事の結論「全部試せ」にそのままつながっていきます。それは後半で。まずは私自身の遍歴と本音から。

AIを3つ乗り換えた遍歴

時期メインAIきっかけ
初期Gemini最初に課金した
中期ChatGPTレスポンスとコスパ
一時ChatGPT寄りClaudeのトークン消費が気に
現在Claude容量増+信頼性で出戻り

まず痛い目を見た話(Gemini期)

正直に書くと、私のAI遍歴は失敗から始まりました。

Geminiに課金して使っていた頃、ハルシネーション(AIが平気で嘘をつく現象)で何度もやられました。

  • 使えないAmazon商品を「これがオススメ」と言われて買わされる
  • 書類申請の手順を信じたら間違っていて、窓口で恥をかく
  • 電話問い合わせの内容が事実と違っていて気まずい思いをする

特にこの時期のGeminiは、嘘のアドレスやデータを平気で出してくるのが衝撃でした。「とにかくユーザーがその場で喜べばいい」みたいな価値観に感じられて、逆にびっくりしたのを覚えています。

※これは私が使っていた時期の話です。今のGemini(最新は3.5系)はかなり改善されているはず。当時の印象が強烈すぎて引きずっているだけかもしれません。実際、この記事を書いている最中にもGeminiは3.5系へ更新されました。進化のスピードがとにかく速い。

ともあれ、この経験で「AIの言うことは鵜呑みにせず、必ず裏を取る」という鉄則が骨身に染みました。さっきのGPT-5.6の噂を「噂」と切り分けたのも、この鉄則のおかげです。ハルシネーションは本当に気をつけないといけません。

各AIの本音レビュー

乗り継いできた今の率直な評価です。

AI一言で得意分野信頼度こんな人に
ChatGPTオールラウンダー万能・画像・PC操作★★★★☆1つだけ選ぶ初心者
Claude深い思考と誠実さ文章・コード・分析★★★★★じっくり作業する人
Gemini映像とGoogle連携動画・長文・PDF★★★☆☆映像・長文処理が多い人
Grok伸びしろの新星リアルタイム・X連携★★★☆☆トレンドを追う人

ChatGPT:万能のオールラウンダー

とにかくレスポンスが速い。性能もどんどん上がっていて、純粋な実力はClaude並みになってきたと感じます。

そして何より、スピード・性能・トークンの余裕を総合すると、体感でClaudeの5倍くらい気軽に使える。くだらない質問を投げても気にならない懐の深さがあります。

「ガチ勢以外に1つだけ勧めるなら?」と聞かれたら、今は迷わずChatGPTを推します。

Claude:深い思考と、何より信頼できる

Claudeの一番の魅力は、性能の高さ以前に信頼できること。

「一を知って十を知る」的な察しの良さがあって、しかも人間と同じで、わからないことは「わからない」と言うし、確信が持てないことは必ずこちらに確認してくる。この誠実さが大きい。さっき書いたOpus 4.8の「正直さ」の話も、まさにこの延長線上にあります。

ただし、トークンを気にしながら使う必要があるので、くだらない質問は避けるようにしています。ここぞという深い作業を任せる相棒、という位置づけ。

実際、アフィリエイトサイトのリニューアル更新をClaudeにやらせたら、あまりに簡単で驚きました。コツコツ数年かけて育てたサイトと同等のものが、下手すると1日でできてしまう。デザインも最高でした。

Gemini:映像はやはり強い

失敗体験を書きましたが、映像・動画分野ではやはりGeminiが強いと思います。Google連携も含めて、用途がハマればこれ一択になる場面はある。嘘の印象が強烈だっただけで、得意分野は確かにあります。

Grok:化ける可能性アリ

まだ汎用性では他に一歩譲る印象ですが、X連携やリアルタイム性、最近の映像・エージェント機能の強化を見ていると、化ける可能性は十分あると思っています。Grok 5の噂も6月戦線に名前が挙がっている。要注目枠です。

結論:「どれを選ぶか」じゃない、「全部試せ」

ここまで書いておいてなんですが、私の結論は「どれか1つを選ぶ」という考え方が間違いということです。

そして、この結論を一番きれいに証明してくれているのが、冒頭に書いた「6月のモデル激突」そのものなんですよね。

  • 旬のAIは常に入れ替わる(Opus 4.8が出た瞬間に「数週間後にMythos」、横でGPT-5.6の噂、Geminiも更新…と、もう順位が確定する暇がない)
  • AIにも向き不向き、相性がある
  • そして全体のレベルが急激に進化していて、そのうち差がなくなりそう

だから、同時に複数使うのが無難。そのうえで、メインだけ課金する。今は私はメイン1つ課金ですが、複数課金もアリだと思います。

「今のベストAIはこれ!」と断言した記事は、来月にはもう古くなっている可能性が高い。特定の1社に賭けるより、全体の波に乗り続けるほうが、この時代は強い。ガチ勢はそもそも全部課金しているでしょうし、1つに決めることがどれだけリスクか分かっているはず。「どれを選ぶべきか」ではなく「全部使いながら試すべき」。これが今の私の答えです。

その先にあるもの——AGI、ロボティクス、電力

最近のAIは、どこもエージェント化に向かっています。エージェント機能がもっと安く使えるようになったら、世の中は本当に変わると思います。Opus 4.8のファストモードが3倍安くなったのも、その流れの一歩でしょう。

個人的に気になっているのは:

AGI(汎用人工知能)はいつ来るのか。 今年か来年には来そうな気配がある。そしてAIがAIを進化させたり、自己増殖するようになったら、一気に加速するはず。Mythosが「AIが自律的に脆弱性を見つける」段階に来ている時点で、その入口は見えている気がします。

そこから先は「電力」勝負。 ASI(超知能)レベルとなると、物理的制約が立ちはだかる。GPU、そして何より電力が足りない。AIがどれだけ賢くなっても、動かすエネルギーがなければ意味がない。

日本はロボティクスで復活できるか。 人口オーナス(働く世代が減る社会)を乗り越えるには、もうロボティクスしかない。ロボティクスと世界モデルが進めば、世の中はかなり変わる。

ユートピアか、ディストピアか。 正直、どちらに転ぶかは分からない。でも個人的には、AIそのものの脅威より、悪意のある利用者のほうがよほど怖いと思っています。Mythosが「危険すぎて封印」されていたのも、結局は使い手の問題ですよね。

色々書きましたが、結局のところ大事なのは「何をするのか、何を成すのか、AIに何をやらせるのか」。道具がどれだけ進化しても、そこは変わりません。

今の時代に生きていて良かった。ユートピアかディストピアか、それを見届けてから死にたいと思っています。

おまけ:AI界隈の「スコップ売り」たちw

最後に一言だけ。

最近のAI系の動画の人たち、LINE登録させてプレゼント・無料セミナー、みたいなのが多いですよね。これ、昔の情報商材の時代とまったく変わってないwww

そもそも自分で儲かるなら、とことんそれで儲ければいい話。儲け話を人に勧める暇があったら自分でやれよ、と思ってしまう。今回みたいに「GPT-5.6のスペック完全解説!」みたいな噂ベースの煽り記事が量産されるのも、結局は同じ構造です。

ゴールドラッシュで一番儲けたのは、金を掘った人じゃなくてスコップを売った人——というアレですね。ツール系のプレゼントもそうですが、要はリスト化して儲けようとしているだけ。

まあ、当時の情報商材よりはAIのほうがちゃんと貢献していそうなので、そこは救いですがw それにしてもパターンが同じすぎる。

まとめ

  • 2026年6月は、Opus 4.8・Mythos・GPT-5.6(噂)・Gemini 3.5系・Grok 5(噂)が一斉にぶつかる決戦月になりそう
  • Opus 4.8の目玉は「正直さ」。わからないことは答えを差し控える誠実さがベンチで証明された
  • AIの言うことは鵜呑みにしない。ハルシネーションは本当に怖い。噂は噂と切り分ける
  • ChatGPTは万能型、Claudeは信頼性、Geminiは映像、Grokは伸びしろ
  • 「どれを選ぶか」より「全部試して、メインだけ課金」。激突月こそ、その答え合わせ
  • AGI・ロボティクス・電力——これからが本番。AIより怖いのは、それを悪用する人間

この数か月でAIの趨勢がどんどん変わって、さらに加速度が増している。年内にどう変化するかで、これからの5年・10年が見えてくる気がします。

いずれにしても、まだ途中。渦中である。これからが本番です。