MAIとは何か？7つのAIモデルで変わる業務のかたち

2026.06.23

2026年6月、サンフランシスコで開催された「Microsoft Build 2026」の基調講演（Keynote）において、Microsoftは新たなAIモデル群「MAI（Microsoft AI）」を発表しました。今回の発表は、単に新しいAIが追加されたというものではなく、AIを業務の中でどのように使い、どのように組み込んでいくかという考え方そのものに変化をもたらす内容となっています。
従来のAI活用は単一モデルによる支援が中心でしたが、MAIは複数のAIモデルが役割分担しながら連携することで、業務全体を支えることを前提に設計されている点が特徴です。
本ブログでは、そんなMAIの特徴やCopilotとの関係について整理していきます。

MAIの考え方：AIの活用は「点」から「流れ」へ

これまでのAI活用は、文章生成や画像生成など、特定の機能を単体で使う「点」の活用が中心でした。一方でMAIは、こうした個別機能をつなぎ、業務を一連の「流れ」として支えることを前提に設計されています。
この考え方により、AIは単なる作業支援ツールから、業務プロセス全体を支える存在へと役割が広がります。個別作業を効率化する段階から、業務の進め方そのものを最適化する段階へと進む点が、MAIの本質的な変化といえます。
また、用途に応じて適切な処理を組み合わせることで、より実務に即した柔軟な活用が可能になります。これにより、AIは業務の中に自然に組み込まれ、全体の生産性を底上げする基盤として機能していきます。

MAIを構成する7つのモデル

MAIの中心となる「頭脳」の役割を担うのが、推論モデルの「MAI-Thinking-1」です。このモデルは複雑な問題の整理や意思決定の補助を担い、ソフトウェア開発や数理領域においても高度な推論能力を持つとされています。複数のステップを必要とするタスクに対応できる点が特徴であり、他のモデルの処理を方向づける役割も担います。

次に開発業務を支えるのが、コーディング特化モデル「MAI-Code-1-Flash」であり、推論効率を重視した設計となっています。このモデルはGitHubやVS CodeといったMicrosoftの開発基盤との統合が前提となっており、コード生成や修正作業、業務の自動化を支援します。効率性を重視した設計により、実務で扱いやすい性能バランスが特徴です。

画像領域では「MAI-Image-2.5」が中心的な役割を担います。このモデルはテキストからの画像生成に加えて、既存画像の編集にも対応しており、資料作成やビジュアル表現の強化に活用できます。また「MAI-Image-2.5 Flash」という軽量モデルも提供されており、用途に応じた使い分けが可能です。

音声処理の領域では「MAI Transcribe-1.5」が文字起こし機能を担います。このモデルは高精度な音声認識を特徴とし、複数言語や専門用語にも対応しています。会議記録や音声データの整理といった用途で高い実用性を持つモデルです。

音声生成を担うのが「MAI-Voice-2」です。このモデルは自然な音声を生成できるほか、短い音声サンプルから話し方を再現する機能を備えています。さらに軽量版である「MAI-Voice-2 Flash」も用意されており、リアルタイム性が求められる場面での活用が想定されています。

このように、MAIの7つのモデルはそれぞれ明確な役割を持ち、推論・生成・変換といった異なる処理を分担します。これらは同一の基盤とデータポリシーのもとで設計されており、統一された品質と連携性を保ちながら動作する構造となっています。

▼MAI（Microsoft AI）を構成する7つのモデルの特徴

7つのモデルが連携することで生まれる価値

これら7つのモデルの価値は、それぞれ単体での機能にあるのではなく、連携して利用できる点にあります。例えば、会議音声を文字起こしし、その内容を整理し、資料としてまとめ、さらに音声で説明するといった一連の流れを、複数のAIモデルが連携して支援することが可能になります。これまで複数のツールや手作業で分断されていたプロセスが、より統合された形で実現できる点が大きな変化です。

Copilotとの関係

MAIの構造は、Copilotの役割にも直接的な影響を与えます。Copilotはこれまでユーザーの操作を支援するインターフェースとして機能してきましたが、MAIのような複数モデル基盤の上に成り立つことで、その役割はより広範囲に拡張されていきます。ユーザーがCopilotに対して指示を出すと、その裏側ではMAIの各モデルが役割分担を行い、推論・生成・変換といった処理を適切に組み合わせながら実行します。

具体的には、ユーザーの入力内容に応じて、推論モデルが処理方針を決定し、必要に応じてコード生成モデルや画像生成モデル、音声モデルが適切に呼び出される形となります。このように、Copilotは単一のAIとして振る舞いながら、内部では複数のモデルが連携して動作する構造となります。これによりユーザー体験はシンプルなまま、裏側の処理はより高度化されることになります。

また、MAIの各モデルがMicrosoftの製品群や開発基盤に統合される前提で設計されている点も重要です。Copilotはそのインターフェースとして機能し、ユーザーとMAIをつなぐ役割を担うことで、AI活用をより自然な形で業務の中に組み込むことが可能になります。

まとめ

MAIは7つのAIモデルが役割分担しながら連携することで、業務全体を支援する新しいアプローチを提示しています。推論、開発、表現といった機能を組み合わせることで、これまで分断されていた業務プロセスが一体化されていく点が最大の特徴です。今後のAI活用においては、単一の高性能モデルを選択するだけでなく、複数のモデルをどのように組み合わせて業務に組み込むかが重要になるため、MAIはその方向性を示す象徴的な取り組みといえるでしょう。

※参考：https://microsoft.ai/news/building-a-hillclimbing-machine-launching-seven-new-mai-models/

ピーエスシーではCopilotを含むMicrosoft製品の利活用支援を行っておりますので、ご希望の場合はぜひお問い合わせください！

▼お問合せはこちらから
お問合せ｜Coo Kai クーカイ｜株式会社ピーエスシー

【関連リンク】
▼ピーエスシー Copilot Service Menu
【Microsoft 365 Copilot】使い倒すための5つのメニュー｜トピックス｜PSC Smart Work

▼Microsoft 365 Copilot「Cowork」とは？仕事を“任せる”新しいAIの実力
Copilot Cowork|Microsoft BLOG｜Coo Kai クーカイ｜株式会社ピーエスシー

▼AI管理改革――Agent 365 がもたらす新しい管理体験
Agent 365|Microsoft BLOG｜Coo Kai クーカイ｜株式会社ピーエスシー