本記事は、最新の公開情報を基に GPT-4.1 mini と GPT-5 mini/GPT-5 nano を「コスト($/100万トークン)」「コンテキスト長」「実効スピード(TPS)」などの観点で比較し、用途別の最適解を示します。
価格は公式・準公式の一次/準一次情報、性能は独立系ベンチや実測報告を中心に整理しています。
結論
- 最安・高スループット重視なら GPT-5 nano:
入力$0.05/出力$0.40で、日常の分類・要約・オートコンプリートに最も費用対効果が高い選択肢。コンテキストも40万トークン級。 - 汎用の高コスパなら GPT-5 mini:
入力$0.25/出力$2.00。実測で約170TPSとされ、4.1系より出力の速さが期待できる。高度推論が不要でも「速く・安く・そこそこ強い」を取りたい場面に合う。 - 超長文や安定運用なら GPT-4.1 mini:
1Mトークン級の巨大コンテキストを持ち、価格も入力$0.40/出力$1.60と読みやすい。長文 RAG、長期会話、運用実績重視に。
価格・コンテキスト仕様の比較
以下は「$/100万トークン」単価とコンテキストの要点です。
詳細値と根拠は表下の解説に記載します。
| モデル | 入力$/M | 出力$/M | コンテキスト |
|---|---|---|---|
| GPT-5 mini | $0.25 | $2.00 | 約40万級 |
| GPT-5 nano | $0.05 | $0.40 | 約40万級 |
| GPT-4.1 mini | $0.40 | $1.60 | 約104.8万 |
ベンチマーク(実効スピード&代表値)
公開ベンチは評価設計(reasoning effort や温度、出力制御)で大きく変動します。
特に GPT-5 は推論段階の「思考量」を指定でき、High 設定では知能指数的な指標が大幅に上がる一方、トークン消費とレイテンシが増えます。Minimal 設定では 4.1 系に近い知能帯&低消費になるという報告があります。
| モデル | スループット | 代表ベンチ | 注記 |
|---|---|---|---|
| GPT-5 mini | ≈170 TPS | AIME/GPQA 等で高水準報告 | High設定で知能指数が大きく向上 |
| GPT-5 nano | 記載不足 | 廉価・高速の位置づけ | 要約・分類向けに最適化 |
| GPT-4.1 mini | ≈122 TPS | IFEval 84.1%、Aider 31.6% | 長文タスクで安定 |
TPS は実測系ブログで GPT-5 mini ≈170 TPS、GPT-4.1 ≈122 TPS の報告があります。
4.1 mini の個別評価(Hard Instruction、MultiChallenge、IFEval、Aider など)は OpenRouter のモデルカードに掲載があります。
また、独立系アグリゲータ Artificial Analysis は「GPT-5 は reasoning 設定により知能指標が大きく変化、High で頭一つ抜ける」等のまとめを掲出しています(スコア体系は自社指数)。
どれを選ぶべきか(ユースケース別)
- 大量の要約・タグ付け・軽量 Reasoning:最安の GPT-5 nano。
入力$0.05/出力$0.40で回すバッチ処理に最適。 - 日常開発のデフォルト:GPT-5 mini。
価格は抑えつつスループットが高く、複数エージェントや長めの回答生成にも向く。 - 超長文のRAG/長期会話履歴:GPT-4.1 mini。
約100万トークンの巨大文脈が武器。
運用時の実務ポイント
- 入出力のコスト構造に注意:
GPT-5 系は出力側が相対的に高め(例:mini は $2.00/M)。冗長出力はコスト直撃。出力上限・要約器・構造化出力で制御する。 - reasoning effort の設計:
難問のみ High、通常は Minimal/Low にする「段階推論」設計で 速度×費用 の最適化を狙う。 - コンテキスト計画:
GPT-5 系は「入力27.2万/出力12.8万」の設計(合計40万級想定)。長文 RAG は 4.1 mini の 1M 枠か、要約分割+再結合で。

コメント