MiniMax在儿童节当天扔出了一枚重磅炸弹。6月1日,全新旗舰模型MiniMax-M3正式上线,主打原生多模态与最高100万token超长上下文,专为Agent推理、代码和长文档场景优化。这个参数配置在国产大模型中相当罕见。

原生多模态:文本图片一把梭
区别于传统的”拼接式”多模态方案,MiniMax M3采用原生多模态架构,文本和图片在同一个模型中完成理解与生成,无需额外适配层。这意味着开发者调用API时无需区分”视觉模型”和”语言模型”,一套接口搞定所有需求。
在实际测试中,MiniMax M3对复杂图表、截图、扫描件的识别准确率有明显提升。对于需要处理大量文档素材的AI应用来说,这种统一处理能力能大幅简化开发流程。
100万token上下文:能塞下三本《三体》
100万token的上下文窗口是本次发布最受关注的核心参数。换算成中文约等于可以一次性处理近200万字的内容——相当于三部《红楼梦》的体量。

超长上下文的直接受益场景包括:代码仓库级别的项目分析、整本书籍的总结归纳、超长会议记录的要点提取、多轮对话历史的完整回顾。对于需要构建复杂Agent的企业用户来说,这个参数意味着可以减少上下文截断带来的信息丢失。
不过需要注意的是,100万token的超长文本能力目前为限量供应,官方预计几日后全量开放。
定价策略:开发者友好
价格方面MiniMax延续了国产模型的竞争策略:512K token以内输入2.10元/百万token、输出8.40元/百万token。新上线7天内还有五折优惠活动。

对比同规格的GPT-4o和Claude 3.5 Sonnek,这个定价对国内开发者相当友好。特别是对于初创团队和独立开发者来说,在预算有限的情况下有了更多选择。
谁该关注MiniMax M3?
如果你的业务涉及以下场景,MiniMax M3值得测试:代码分析和重构、长文档处理与分析、多模态内容理解、企业知识库问答、复杂Agent开发。
目前MiniMax M3已通过API和Token Plan开放,OpenCode平台还有限时免费体验额度。有兴趣的开发者可以前往MiniMax官网申请试用,亲身感受这个国产大模型新旗舰的实际表现。
你对100万token上下文有什么具体的使用场景想象?欢迎在评论区聊聊你的想法。






