【GTMF 2025】アリババクラウドが提示する「アイデアがゲームになる未来」―テキスト生成LLM「Qwen」と画像・動画生成LLM「Wan」がもたらす開発革新 | GameBusiness.jp

【GTMF 2025】アリババクラウドが提示する「アイデアがゲームになる未来」―テキスト生成LLM「Qwen」と画像・動画生成LLM「Wan」がもたらす開発革新

世界トップクラスの性能を誇るテキスト生成LLM「Qwen」シリーズや、最新の動画生成モデル「Wan 2.5」、そしてこれらを支える強固なインフラストラクチャーについて紹介しました。

その他 イベント
PR
【GTMF 2025】アリババクラウドが提示する「アイデアがゲームになる未来」―テキスト生成LLM「Qwen」と画像・動画生成LLM「Wan」がもたらす開発革新
  • 【GTMF 2025】アリババクラウドが提示する「アイデアがゲームになる未来」―テキスト生成LLM「Qwen」と画像・動画生成LLM「Wan」がもたらす開発革新
  • 【GTMF 2025】アリババクラウドが提示する「アイデアがゲームになる未来」―テキスト生成LLM「Qwen」と画像・動画生成LLM「Wan」がもたらす開発革新
  • 【GTMF 2025】アリババクラウドが提示する「アイデアがゲームになる未来」―テキスト生成LLM「Qwen」と画像・動画生成LLM「Wan」がもたらす開発革新
  • 【GTMF 2025】アリババクラウドが提示する「アイデアがゲームになる未来」―テキスト生成LLM「Qwen」と画像・動画生成LLM「Wan」がもたらす開発革新
  • 【GTMF 2025】アリババクラウドが提示する「アイデアがゲームになる未来」―テキスト生成LLM「Qwen」と画像・動画生成LLM「Wan」がもたらす開発革新
  • 【GTMF 2025】アリババクラウドが提示する「アイデアがゲームになる未来」―テキスト生成LLM「Qwen」と画像・動画生成LLM「Wan」がもたらす開発革新
  • 【GTMF 2025】アリババクラウドが提示する「アイデアがゲームになる未来」―テキスト生成LLM「Qwen」と画像・動画生成LLM「Wan」がもたらす開発革新
  • 【GTMF 2025】アリババクラウドが提示する「アイデアがゲームになる未来」―テキスト生成LLM「Qwen」と画像・動画生成LLM「Wan」がもたらす開発革新

2025年7月、ゲームツール&ミドルウェアフォーラム「GTMF 2025」において、アリババクラウドによるセッション「アイデアがゲームになる未来 アリババAIが解き放つ、次世代クリエイションの扉」が実施されました。

登壇した同社AIソリューションアーキテクトの藤川裕一氏は、EC企業のイメージが強いアリババグループが、実は世界有数のAI技術とクラウドインフラを持つ「社会インフラ」企業であることを強調。世界トップクラスの性能を誇るテキスト生成LLM「Qwen」シリーズや、最新の動画生成モデル「Wan 2.5」、そしてこれらを支える強固なインフラストラクチャーについて紹介しました。

本稿では、オープンソース戦略と高度なマルチモーダル技術がいかにゲーム開発の効率化とクリエイティビティに貢献するか、その詳細をレポートします。

技術集団としてのアリババグループ

講演の冒頭、藤川氏はアリババグループの全体像について触れました。

グループ内には、物流、卸売、エンターテインメント、そして藤川氏が所属する「アリババクラウド」や、AI研究機関である「Tongyi Lab(通義実験室)」が存在します。特にAI分野においては、莫大な資金を投じて世界中から研究者を集め、最先端の研究開発を行っていると藤川氏は語ります。

「我々のサービスはAIが中心となって運用されている」と藤川氏は紹介。ECサイトでのレコメンドや商品ページ生成、物流における最適ルート算出など、グループの多岐にわたるサービス実運用の裏側で、自社開発のAI技術が活用されています。

Alibaba Cloud コーポレートサイト

世界トップレベルの性能と多様性を持つLLM「Qwen」

続いて藤川氏は、同社の主力であるテキスト生成LLM「Qwen(通義千問)」シリーズを紹介しました。「Qwen」の特徴として、藤川氏は「多様性」と「オープンソース」の2点を挙げました。

汎用的な巨大モデルを提供するのではなく、各タスクに合わせて最適化されたモデルを提供することで、軽量ながら高い精度を実現しています。また、オープンソース戦略をとることで、ユーザーが日本語性能の向上や業界特化の知識を学習させる「ファインチューニング」を容易に行える環境を提供しています。

「Qwen」シリーズの中でも、最上位モデルである「Qwen3-Max」は、パラメータ数が1兆以上という大規模モデルです。藤川氏は「LM Arenaなどのベンチマークにおいて、世界トップレベルの性能を達成しています」と述べ、他社の主要モデルと比較しても遜色のない、あるいは凌駕する性能を持っていることを示しました。

汎用的なテキスト生成だけでなく、ゲームやエンタメ分野での活用を想定した「Qwen-Character」についても紹介されました。これは、AIモデルに特定の性格や背景ストーリーを設定できる特化型モデルです。

藤川氏は「チャットボットとして使いやすいモデル」と説明し、ユーザーとの対話を通じてキャラクターの世界観を構築できる点を強調しました。ゲーム内のNPC(ノンプレイヤーキャラクター)との自然な会話や、キャラクターとの親密度を深めるコンパニオンアプリなどへの応用により、ユーザーエンゲージメントの向上が期待できます。

また、プログラミングに特化した「Qwen3-Coder」についても言及。多様な連携機能を備えたアプリケーションを利用することで、自然言語での指示からコード生成や修正が可能となり、開発効率を大幅に向上させることができます。

Qwen 公式サイト

クリエイティブ制作を変革する動画生成モデル「Wan」

ゲーム開発において特に注目されるのが、画像・動画生成AIモデル「Wan(通義万相)」です。最新版となる「Wan 2.5」はAPI経由でも利用可能で、最大10秒間の1080p動画を生成できます。

藤川氏はデモを交えながら、以下の機能を解説しました。

  • Text-to-Video / Image-to-Video: テキストや静止画から高品質な動画を生成。

  • 動画編集機能: 動画内の一部をマスクし、特定の人物や背景を別のものに差し替えるインペイント機能。

  • アバター生成: 1枚の人物画像と音声データから、リップシンク(口の動き)や表情を同期させた動画を生成。

これらの技術は、ゲーム内のカットシーン作成や、キャラクターの3面図(正面・横・後ろ)の生成、プロモーション用トレイラーの制作など、クリエイティブな現場での活用が期待されます。

Wan 公式サイト

リアルタイム対話を実現する「Qwen-Omni」

さらに、テキスト、音声、画像を同時に処理できるマルチモーダルモデル「Qwen-Omni」も紹介されました。

デモ動画では、カメラで映した手書きの数式を即座に認識して解法を提示したり、外国語のメニューを読み取って料理の説明をしたりする様子が披露されました。特に音声対話においては、ノイズ除去機能や割り込み会話への対応など、人間との自然な対話を実現するための機能が備わっています。

藤川氏は「APIを利用してリアルタイムのASR(音声認識)とTTS(音声合成)を組み合わせることで、ユーザーと深い繋がりを持てるチャットボットなどを構築できます」と説明しました。

日本国内にデータセンターを有す強固なAIインフラ

最後に、これらのAIモデルを支えるインフラストラクチャーについて解説がありました。アリババクラウドはアジアを中心にグローバルでデータセンターを展開しており、日本国内にも拠点を構えています。これにより、日本の法規制に基づいたデータ保護が可能となり、企業は安心してサービスを利用できます。

また、AI開発プラットフォーム「PAI(Platform for AI)」や、クラウドリソースを効率的に利用するための独自技術により、コストパフォーマンスの高い開発環境を提供している点も強調されました。

まとめ

本講演では、アリババクラウドが単なるクラウドベンダーにとどまらず、実用性の高いAIモデルとそれを支える強力なインフラを提供するプラットフォーマーであることが示されました。

特に、オープンソースで提供される「Qwen」の高いカスタマイズ性や、「Wan」による高品質な動画生成は、ゲーム開発におけるアセット制作の効率化や新たな表現の創出に大きく寄与するでしょう。今後のゲーム業界におけるアリババクラウドの存在感はますます高まりそうです。

Alibaba Cloud コーポレートサイト


《GameBusiness.jp》

この記事の感想は?

  • いいね
  • 大好き
  • 驚いた
  • つまらない
  • かなしい
【注目の記事】[PR]

関連ニュース

特集

人気ニュースランキングや特集をお届け…メルマガ会員はこちら