小目录

MiniMax开放平台

MiniMax 是全球领先的多模态大模型开放平台，提供自研的文本、语音、视频、图像和音乐模型

MiniMax 是全球领先的多模态大模型公司，致力于“与所有人共创智能”。开放平台提供了一系列自研的多模态AI模型，覆盖文本、语音、视频、图像和音乐五大领域，支持开发者通过API快速集成，适用于生产力工具、内容创作、智能助手、Agent 等场景。

以下是 MiniMax 平台主要模型的产品介绍：

文本模型（Text Models）

MiniMax 在文本生成、编程和复杂对话方面表现突出，尤其适合代码工程和 Agent 工作流。

MiniMax-M2.1（旗舰文本模型）
强大多语言编程能力，全面升级代码工程体验。支持代码生成、重构、多语言编程，性能领先。230B 总参数（推理时激活 10B），适合高精度编程任务。
MiniMax-M2.1-lightning
与 M2.1 效果相当，但速度大幅提升，适合对延迟敏感的场景。
MiniMax-M2
专为高效编码与 Agent 工作流设计，支持超长上下文（部分版本达 200k tokens），性价比高。
M2-her
专为角色扮演、多轮对话、长轮次复杂场景设计，支持多角色沉浸式扮演，适合虚拟人物、情感陪伴、长对话互动。

语音模型（Speech Models）

MiniMax 语音模型以高音质、低时延和真实感著称，特别适合实时 Agent 和智能语音交互。

Speech-2.8-HD（新一代 HD 版）
精准还原真实语气细节，音色相似度极高，支持多语言、多情感。
Speech-2.8-Turbo
响应极速、语气生动自然，适合低延迟实时对话场景。
Speech-2.6-HD / Speech-2.6-Turbo
旗舰语音系列，音质极致、韵律优异，超低时延，智能生动，专为 Agent 场景优化。
Speech-02-HD / Speech-02-Turbo
早期经典系列，稳定性强，小语种支持好，音质和复刻能力突出。

视频模型（Video Models）

以 Hailuo（海螺） 系列为主，在动态表现、物理真实感和指令遵循上达到行业领先。

MiniMax Hailuo 2.3（旗舰）
全新视频生成模型，肢体动作、面部表情、物理表现大幅突破，支持文生视频、图生视频。
MiniMax Hailuo 2.3 Fast
速度更快、价格更优，物理表现和指令遵循依然优秀，适合快速迭代创作。
MiniMax Hailuo 02
支持 1080p 原生分辨率，指令遵循和物理表现达到 SOTA（state-of-the-art）水平。

图像模型（Image Models）

image-01
画面细腻，支持文生图、图生图。
image-01-live
增强手绘、卡通等多种画风，支持更灵活的风格控制。

音乐模型（Music Models）

music-2.5（最新）
全维度突破，支持指挥细节定义，生成更真实、细节丰富的音乐。

总体特点与优势

多模态能力强：文本、语音、视频、图像、音乐全栈自研，支持无缝组合。
性能与性价比：旗舰模型在编程、视频动态、语音时延等多个维度领先，同等性能下成本往往显著低于国际竞品。
适用场景：编程助手、AI Agent、内容创作（短视频、音乐、配音）、角色扮演聊天、虚拟人、多模态生产力工具等。
调用方式：支持 Anthropic SDK 等兼容接口，平台提供快速上手指南。