研究团队在两个业内公认的代码修复难题测试集上验证了这个方法。结果让人眼前一亮:这个会自己跟自己玩的AI,表现居然超过了那些用人类精心整理的数据训练出来的AI。这意味着什么?意味着AI可能找到了一条不依赖人类知识的成长路径。当AI不再依赖人类经验时 ...
MiniMax-M2.1 在 VIBE 综合榜单中表现卓越,以平均 88.6 分的成绩展现了接近Claude Opus 4.5的全栈构建能力,并在几乎所有子集上都显著优于Claude Sonnet 4.5。 很多模型都是能写 Java,也能写 ...
The project adopts a front-end and back-end separation architecture: WECHAT_WEBHOOK Empty WeChat notification webhook URL FEISHU_WEBHOOK Empty Feishu notification webhook URL ...
请媒体朋友们不要报道我们,让我们有更长久的时间可以收集整理数据。我们最怕捧杀了,您让我们保持低调,就是对中文算法圈做了大的贡献! 中文互联网上最古老最神秘(没有之一)的MOP里屋社区于2023.1.1庄重宣布: 在英明神武的猫扑管子带领下,决心发挥社区 ...
用LLM在真实世界中「捉虫」 AI首次发现真实世界中的重大安全漏洞?SQLite中的一个漏洞,幸运地被谷歌研究者的AI Agent发现了,修复后并未造成任何损失。莫非AI再进化一番,微软的全球蓝屏事故就可以永久避免了?这个可能性令人激动不已。