Googleが、先日のGemini 3 Proに続き、主に一般ユーザーと開発者に向けとなるGemini 3 Flashをリリースしました。
Gemini 3シリーズのウリである複雑な推論や、視覚的解釈、バイブコーディングタスクなどにおいて「Flashレベルのレイテンシー、効率、コスト」を実現するとうたっています。
GoogleはGemini 3 Flashが最先端レベルの推論能力とマルチモーダル機能に加え、品質とコスト・速度のパレート最適解を追求する高い効率性を備えるとし、複雑なユースケースではより長い思考時間を要するものの最高レベルの思考処理時には思考量を調節することが可能だと述べています。
Gemini 3 Flashは、一般ユーザー向けにはGeminiアプリやGoogle検索の「AIモード」のデフォルトAIとしてすでにGemini 2.5 Flashに変わって展開されています。
マルチモーダル推論機能により、あらゆる種類の情報をより速く、見て、聞いて理解することが可能、Geminiに動画や画像を理解させてわずか数秒で、その内容を役立つ実用的な計画に変換できます。
Geminiアプリでは、ゴルフスイングのショート動画から、スイング練習プランを作ったり、落書きを書き終える前に何を描いているかを認識したり、さらには期末試験などの前に自分が難しいと思う項目について自ら説明する音声をアップロードすると、Gemini 3 Flashがその音声を解析して苦手な部分を克服するためのクイズを出力してユーザーの学習に役立てたりといったことが可能だとGoogleは説明しています。
動作モードには「Fast」と「Thinking」の2つが用意され、Fastモードでは素早く答えを導き出し、Thinkingモードは複雑な問題を解くことに比重を置いた動作をします。またより高度な数学やコード作成にはGemini 3 Proも選択できるようになっています。
Google検索のAIモードでも、デフォルトのAIモデルとしてGemini 3 Flashが適用されます。こちらについても「質問のニュアンスをより強力に解析し、クエリのあらゆる側面を考慮し、視覚的に分かりやすく、思慮深く包括的な回答を提供」するとうたわれています。要するに、これまでのGemini 2.5 Flashよりもさらに高速に、賢くなるということです。
そのパフォーマンスに関しては、GoogleはGemini 3 Flashがいくつかのベンチマークで前バージョンであるGemini 2.5 Proを「はるかに上回り、わずかなコストで3倍の速度を実現」すると述べています。また、たとえばMMMU Pro、Toolathlon、MPC AtlasなどにおいてはGemini 3 Proをも凌ぐとも説明しています。
企業や開発者は、反復型開発を得意とするように設計されたGemini 3 Flashにより、高頻度ワークフローにおいて、タスクを迅速に推論・解決することが可能だと説明されています。関連するベンチマークとして、コーディングエージェント能力を評価するベンチマークSWE-bench Verifiedで78%のスコアを達成しており、これはGemini 3 Proの同ベンチマーク結果よりも好結果だったとGoogleは宣伝しています。
より複雑な動画分析、データ抽出、ビジュアルQ and Aを実行したい開発者にもGemini 3 Flashは最適で、迅速な回答と深い推論の両方を必要とする、ゲーム内アシスタントやA/Bテスト実験などのよりインテリジェントなアプリケーションを実現できるとのことです。
ビジネス・開発者向けのGemini 3 Flashモデルの価格は、入力トークン100万件あたり0.50ドル、出力トークン100万件あたり3ドルとなっており、Gemini 2.5 Flashの入力トークン100万個あたり0.30ドル、出力トークン100万個あたり2.50ドルよりもやや高くなっています。
ただ、Googleの主張では新モデルはGemini 2.5 Proモデルを上回る性能を発揮しつつ、処理速度が3倍速いとのこと。思考タスクではGemini 2.5 Proよりも平均30%少ないトークン数で処理できるとされており、特定のタスクにおいてはGemini 3 Flashのほうがトークン消費を抑えられる可能性もありそうです。












