在当今迅速发展的科技领域,人工智能(AI)已不再是一个新鲜话题,然而,MiniMax最新发布的M2.1模型却为AI编程带来了令人瞩目的突破。这款新模型在编程领域的全方位能力提升,不仅在前端3D交互和移动应用开发中展现出卓越的代码生成能力,更在后端服务开发上表现得尤为出色。其在VIBE基准测试中获得的88.6分,标志着AI正在从单一功能演示迈向复杂工程实践的新时代。
首先是物理手感。一般的大模型写重力感应,往往就是简单的把传感器数值赋给位置,导致操作起来生硬得很,要不就是移动的非常慢,要不就是移动不顺畅,要不手抖一下飞机就乱跳。
这一次,它直接甩出了一份硬核成绩单,在衡量多语言软件工程能力的Multi-SWE-bench榜单中,以仅10B的激活参数拿下了49.4%的成绩,超越了Claude Sonnet 4.5等国际顶尖竞品,拿下全球SOTA。
12 月 23 日,MiniMax 发布 M2.1,并即将开源这次升级的核心,是多语言编程能力。较之上代模型,在 Rust、Java、Golang、C++、TypeScript 这些语言上,表现都有很大提升我在 Claude Code 里把模型换成了 ...
如今,5个月过去,「狂飙」的GenAI领域已然大不相同。不仅GPT-4迎来了下一代模型GPT-4o,新发布的Claude 3.5 Sonnet、Codestral等模型都在编码方面性能优秀。 Cosine发布的报告显示,在SWE-Bench中,Genie的得分为30.08%,轻松超越了分数为13.8%的Devin。
On Sept. 3, Chinese President Xi Jinping met in Beijing with Indonesian President Prabowo Subianto, who was attending the 80th anniversary of the victory in the Chinese People's War of Resistance ...