MiniMax M3
BLUF 摘要(点开查看)
MiniMax M3 是 2026-06-01 发布的最新 M 系列模型,主打代码、Agent、1M 上下文和原生多模态;适合 AI Coding 工具、长上下文仓库分析和多步骤 Agent,但购买前要分清 Token Plan、Credits 与 Pay-as-you-go 的 Key 和计费体系。
评分维度详解
官方定位为 Coding & Agentic Frontier,在 SWE-Bench Pro、Terminal-Bench、MCP Atlas 等代码和 Agent 基准上给出较强成绩。
M3 支持 thinking 开关;关闭 thinking 更适合低延迟对话和补全,复杂 Agent 任务开启 thinking 但延迟会更高。
官方 Token Plan 口径为 Plus $20/月、Max $50/月、Ultra $120/月;PAYG 标准通道当前显示 M3 ≤512K 为 ¥2.1/百万输入、¥8.4/百万输出。
M3 刚发布,API、Token Plan、Priority 通道和区域价格仍可能快速调整,生产接入前建议小流量压测。
优缺点分析
- ✓MiniMax-M3 支持 1,000,000 token 上下文,官方说明 512K 以内覆盖多数对话和编程场景
- ✓原生多模态,支持文本、图像、视频、工具调用和 thinking block,适合复杂 Agent 工作流
- ✓Token Plan 适合个人开发者和小团队固定预算使用,文本、图像、语音、音乐资源共享额度池
- ✓同时支持 Anthropic SDK 和 OpenAI / Responses 兼容接入,AI Coding 工具适配成本低
- ✓官方 M3 发布页给出 SWE-Bench Pro 59.0、Terminal-Bench 2.1 66.0、MCP Atlas 74.2 等代码/Agent 基准数据
- ✓MiniMax Code、Codex、Claude Code、Cline、OpenClaw 等 AI Coding 工具已有官方配置指引
- !Token Plan Subscription Key、Credits 和 Pay-as-you-go API Key 是不同体系,初次接入容易填错 Key
- !M3 刚发布,价格、额度、Priority 开放状态和区域支付口径变化较快
- !超过 512K 输入 token 会进入更高长上下文价格,仓库级分析和长视频任务需要提前预算
- !官方性能数据以内部评测和发布页为主,正式业务仍需要用自己的任务复测
- !如果只做轻量中文对话或低成本高频客服,DeepSeek、Qwen、豆包等国内模型可能更简单
基准测试 vs 竞品
| 基准测试 | MiniMax M3 |
|---|---|
| SWE-Bench Pro | 59.0% 最佳 |
| Terminal-Bench 2.1 | 66.0% 最佳 |
| SWE-fficiency | 34.8% 最佳 |
| KernelBench Hard | 28.8% 最佳 |
| MCP Atlas | 74.2% 最佳 |
| BrowseComp | 83.5 最佳 |
定价方案
| 型号 | 输入价格 | 输出价格 |
|---|---|---|
| Token Plan Plus | $20/月 | 约 1.7B M3 tokens/月 |
| Token Plan Max | $50/月 | 约 5.1B M3 tokens/月 |
| Token Plan Ultra | $120/月 | 约 9.8B M3 tokens/月 |
| PAYG M3 标准 ≤512K | ¥2.1/百万;缓存读 ¥0.42/百万 | ¥8.4/百万 |
| PAYG M3 标准 512K~1M | ¥4.2/百万;缓存读 ¥0.84/百万 | ¥16.8/百万 |
| MiniMax-M2.7 | ¥2.1/百万;缓存读 ¥0.42/百万;缓存写 ¥2.625/百万 | ¥8.4/百万 |
| MiniMax-M2.7-highspeed | ¥4.2/百万;缓存读 ¥0.42/百万;缓存写 ¥2.625/百万 | ¥16.8/百万 |
适用场景与建议
- AI Coding 工具:Codex、Claude Code、Cline、OpenClaw、MiniMax Code 等需要长上下文和 Agent 执行的工作流
- 仓库级代码分析:长上下文读取代码库、测试日志、设计文档,再生成修改计划
- 多模态 Agent:需要图像、视频、工具调用和 thinking block 的自动化流程
- 个人/小团队固定预算:使用 Token Plan 控制月度成本,再用 Credits 覆盖溢出
- 不适合:只需要稳定低价中文聊天、客服或轻量批处理的项目,优先对比 DeepSeek V4 Flash、Qwen3.6 Flash 和豆包
总结
MiniMax M3 是 2026 年 6 月值得补充到购买教程和测评列表的新模型:它的价值不在普通聊天,而在长上下文、代码工程、Agent 和多模态工具调用。采购时最重要的是先选计费路径:Token Plan 适合固定额度和 AI Coding 工具,Pay-as-you-go 适合标准 API 按量接入;同时注意 512K 输入 token 以上的长上下文价格和 Key 类型差异。价格、额度和区域支付口径以 MiniMax 官方控制台为准。
- ✓AI Coding 工具:Codex、Claude Code、Cline、OpenClaw、MiniMax Code 等需要长上下文和 Agent 执行的工作流
- ✓仓库级代码分析:长上下文读取代码库、测试日志、设计文档,再生成修改计划
- ✓多模态 Agent:需要图像、视频、工具调用和 thinking block 的自动化流程
- !个人/小团队固定预算:使用 Token Plan 控制月度成本,再用 Credits 覆盖溢出
- !不适合:只需要稳定低价中文聊天、客服或轻量批处理的项目,优先对比 DeepSeek V4 Flash、Qwen3.6 Flash 和豆包
使用前准备
常见问题
MiniMax M3 的性价比怎么样?
官方 Token Plan 口径为 Plus $20/月、Max $50/月、Ultra $120/月;PAYG 标准通道当前显示 M3 ≤512K 为 ¥2.1/百万输入、¥8.4/百万输出。
新手适合用 MiniMax M3 吗?
不适合:只需要稳定低价中文聊天、客服或轻量批处理的项目,优先对比 DeepSeek V4 Flash、Qwen3.6 Flash 和豆包
MiniMax M3 和其他 API 怎么选?
建议先明确你的任务类型,然后查看场景推荐页面。最靠谱的方法是用同一个样本测试 2-3 个 API,对比质量、速度和成本。