2026年3月5日、OpenAIが GPT-5.4 を発表しました。
コンピュータ操作に対応、100万トークンのコンテキストウィンドウ、ベンチマーク更新──。スペックシートだけ見れば文句なしの進化です。
でも、正直に言います。
僕はまだChatGPTに戻る気がありません。半年以上前にChatGPTを解約し、今はClaudeをメインで使い続けています。この記事では、GPT-5.4の実力を正当に評価した上で、なぜClaude派の僕が「それでも戻れない」と感じるのか、そして ChatGPTが覇権を取り戻す日は来るのか を考えます。
GPT-5.4、何が変わった?
まずはGPT-5.4の進化ポイントを整理します。
主な新機能
| 項目 | GPT-5.4の進化 |
|---|---|
| コンテキストウィンドウ | 最大100万トークン(過去最大) |
| コンピュータ操作 | ネイティブ対応(スクリーンショット+マウス+キーボード) |
| ツールサーチ | 必要なツールだけ動的に取得、トークン47%削減 |
| エラー率 | GPT-5.2比で個別の主張の誤り33%減、全体の回答誤り18%減 |
| プロ版 | GPT-5.4 Pro(Enterprise/Pro向け高性能版) |
| 金融プラグイン | Excel/Google Sheetsとのネイティブ連携 |
ベンチマーク比較:GPT-5.4 vs Claude Opus 4.6
| ベンチマーク | GPT-5.4 | Claude Opus 4.6 | 勝者 |
|---|---|---|---|
| SWE-bench Verified(実務コーディング) | 77.2% | 79.2% | Claude |
| SWE-bench Pro(大規模コードベース) | 57.7% | ─ | GPT-5.4 |
| OSWorld(コンピュータ操作) | 75.0% | 72.7% | GPT-5.4 |
| ARC-AGI-2(新規推論) | 52.9%* | 68.8% | Claude |
| BrowseComp(Web閲覧タスク) | 82.7% | ─ | GPT-5.4 |
| GDPval(専門家比較) | 83.0% | ─ | GPT-5.4 |
> 参照: [GPT-5.4 vs Claude Opus 4.6 ベンチマーク比較 - Apiyi.com](https://help.apiyi.com/en/claude-opus-4-6-vs-gpt-5-4-comparison-12-benchmarks-guide-en.html) / [GPT-5.4 vs Opus 4.6 - GlobalGPT](https://www.glbgpt.com/hub/gpt-5-4-vs-claude-opus-4-6/)
数字だけ見ると、 GPT-5.4は「万能型」、Claude Opus 4.6は「コーディング特化型」 という棲み分けが見えてきます。
ChatGPTからClaudeへの大移動が起きていた
GPT-5.4の発表直前、AI業界ではある大きな動きがありました。
ChatGPTからClaudeへのユーザー移動 です。- ClaudeがApple App Storeの無料アプリランキングでChatGPTを抜いて1位に
- Anthropicによると、無料ユーザーは1月以降60%以上増加、有料サブスクライバーは2倍以上に
- 2025年後半だけでClaudeのユーザーベースは40%成長
> 参照: [Users are ditching ChatGPT for Claude - TechCrunch](https://techcrunch.com/2026/03/02/users-are-ditching-chatgpt-for-claude-heres-how-to-make-the-switch/) / [Why Are Millions Leaving ChatGPT? - Built In](https://builtin.com/articles/chatgpt-claude-switching-analysis)
移動の背景には、2025年半ばのGPT-4oの「おべっか問題」(ユーザーに過度に同調するアップデート)や、OpenAIの国防総省との契約に対する懸念がありました。Anthropicが国防総省の大規模監視での利用を拒否したのと対照的に、OpenAIが軍との連携を発表したことが引き金になった面もあります。
でも僕個人が乗り換えた理由は、もっとシンプルです。
半年以上ChatGPTを解約して分かったこと
僕は2025年の後半にChatGPTを解約しました。理由は 「仕事で使うならClaudeの方が圧倒的に実用的だったから」 です。
現在の課金状況
| サービス | プラン | 月額 |
|---|---|---|
| Claude | Max(100ドルプラン) | $100 |
| Gemini | 法人プラン | 約$20 |
| ChatGPT | 解約済み | $0 |
| Genspark等 | 解約済み | $0 |
でも Claude Code(ターミナルで動くAIコーディングツール)が優秀すぎて、サイト制作、システム開発、経理の仕訳帳まで何でもできてしまう ので、100ドルでも十分すぎるほど安い投資だと感じています。
特にOpus 4.6になってからは無敵です。
画像生成だけはClaudeが対応していないので、GeminiのNano Banana(現在はNano Banana 2にアップデート済み)を使っています。Geminiの法人プランが月$20程度なので、 ClaudeとGeminiの2つで月$120 。これで仕事のAI需要はほぼ全てカバーできています。
> 参照: [Nano Banana 2 - Google Blog](https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/)
ChatGPTとClaude、そもそもの「設計思想」が違う
ここが最も重要なポイントです。
ChatGPTとClaudeは、最初から 目指しているもの が違います。
ChatGPT = 「会話の質」を追求
ChatGPTは初期から 自然な対話 を重視してきました。雑談が上手い、共感してくれる、面白い回答をしてくれる。「AIと話す体験」そのものを磨いてきたプロダクトです。
だからこそ2025年の「おべっか問題」は象徴的でした。ユーザーに寄り添いすぎた結果、「何を聞いてもイエスマン」になってしまった。ChatGPTの強みが裏目に出た瞬間です。
Claude = 「実務の質」を追求
一方、Claudeは 「仕事で使える精度」 を最優先にしてきました。コードの正確性、長文ドキュメントの処理能力、指示への忠実さ。「AIに仕事をやらせる」ための道具として設計されています。
Claude CodeやMCP(Model Context Protocol)のようなツールが先に実装されたのも、この思想の現れです。
結果として起きたこと
| 用途 | ChatGPTが得意 | Claudeが得意 |
|---|---|---|
| 日常の雑談・相談 | ◎ | ○ |
| ブレインストーミング | ◎ | ○ |
| コーディング | ○ | ◎ |
| 長文の分析・要約 | ○ | ◎ |
| システム開発 | ○ | ◎ |
| 業務自動化 | ○ | ◎ |
GPT-5.4で「コンピュータ操作」が来た意味
ただし、GPT-5.4の ネイティブコンピュータ操作 は注目に値します。
これはClaude Opus 4.6も持っている機能ですが、GPT-5.4はOSWorldベンチマークで 75.0% を記録し、人間のスコア(72.4%)を超えました。Claudeの72.7%も上回っています。
> 参照: [GPT-5.4 Computer Use, Benchmarks - Digital Applied](https://www.digitalapplied.com/blog/gpt-5-4-computer-use-tool-search-benchmarks-pricing)
これは何を意味するかというと、 OpenAIも「チャットだけのAI」から「仕事をするAI」へ舵を切り始めた ということです。
ChatGPTが「会話相手」から「仕事のパートナー」へ進化しようとしている。GPT-5.4は、その最初の本格的な一歩かもしれません。
今後、ChatGPTは覇権を取り戻せるのか?
率直に言うと、 取り戻す可能性はある と思っています。
シナリオ①:エージェントプラットフォームとしての進化
OpenAIは2026年のロードマップで、ChatGPTを 「AIスーパーアシスタント」 に進化させると宣言しています。Q&Aだけでなく、タスクの実行、アプリ連携、デバイス横断での行動をこなす存在へ。
> 参照: [OpenAI's 2026 Roadmap - The Neuron](https://www.theneuron.ai/explainer-articles/openais-vision-for-2026-sam-altman-lays-out-the-roadmap/)
Excel/Sheetsとの金融プラグイン連携は、まさにこの方向性の第一歩です。 「ChatGPTを開けば、仕事のすべてが完結する」 という世界を目指しているのでしょう。
シナリオ②:価格破壊による裾野の拡大
ChatGPTは月額$8の廉価プランや、広告付き無料プランの導入も計画しています。2026年のOpenAIの売上予測は 200億ドル(約3兆円) 。この巨大な資金力で、Claudeが$100/月で提供している機能を$20で出してくる可能性があります。
> 参照: [OpenAI targets growth with $8 plan - Geeky Gadgets](https://www.geeky-gadgets.com/openai-2026-future-outlook/)
シナリオ③:エンタープライズ市場の制圧
OpenAIの2025年の成長は、エンタープライズ(法人)がコンシューマーを上回りました。大企業のIT部門が「GPT一択」になれば、個人ユーザーも追従する流れができます。Microsoft 365との統合(Copilot)は、Claudeにはない圧倒的な強みです。
それでもClaudeが負けない理由
一方で、 Claudeには「コードに強い」という揺るがない武器 があります。
SWE-bench Verifiedでの実務コーディング性能、Claude Codeの開発者体験、MCPによるツール連携──。これらは「GPTの方が安い」だけでは覆せません。
そして何より、 Anthropicの安全性へのスタンス を支持するユーザーが増えている。技術だけでなく「信頼」で選ばれるAIは強い。
僕たちにとっての最善手は何か?
AI業界の覇権争いが激化するほど、 ユーザーにとっては良いこと です。
- GPT-5.4がClaude Codeに匹敵するコーディングツールを出せば、 Claudeも値下げせざるを得ない
- Claudeが画像生成に対応すれば、 Geminiとの2サービス併用が不要になる
- 競争が進めば、 月$20以下で今の$100プラン相当の性能が手に入る日が来る
今の最善手は 「1つのサービスに固執しない」 こと。
僕の場合は今のところClaude+Geminiの組み合わせがベストですが、GPT-5.4の次のアップデートで状況が変わる可能性もある。大事なのは 「自分の仕事に最も合うツールを、常にアップデートし続ける」 ことです。
まとめ
| 観点 | GPT-5.4 | Claude Opus 4.6 |
|---|---|---|
| コンピュータ操作 | ◎(ベンチマーク1位) | ○ |
| コーディング | ○ | ◎(SWE-bench 1位) |
| コンテキスト長 | ◎(100万トークン) | ○(20万トークン) |
| 推論力 | ○ | ◎(ARC-AGI-2大差) |
| 価格(Plus相当) | $20/月 | $20/月 |
| 開発者ツール | Codex | Claude Code |
| 設計思想 | 会話+万能型 | 実務+コード特化 |
ChatGPTが覇権を取り戻す日が来るとしたら、それは「チャットが上手いAI」を超えて、 「仕事を任せられるAI」 になったときでしょう。GPT-5.4はその方向への大きな一歩ですが、まだ道半ば。
覇権争いの行方は分かりませんが、ひとつ確実なのは── 競争が激しくなるほど、僕たちユーザーが得をする ということです。
タグ



