九坤投资旗下的至知创新研究院发布了开源编程Agent模型IQuest-Coder-V1。至知研究院在AI领域名气不大,但这个模型的benchmark数据直接对标了行业顶尖水平。母公司是量化私募,发布时间是1月,这两个特征组合在一起,很容易让人想起去年 ...
2025年这个春节,DeepSeek一举改写了全球AGI大叙事。在万般热闹之际,我们特别想沉下来做一些基础科普工作。 今天这集,我邀请的是香港科技大学计算机系助理教授何俊贤。他的研究方向是大模型推理,从很早就开始关注DeepSeek的系列研究。我们会focus在最近 ...
最开始公布的测试成绩相当亮眼,在衡量真实软件工程能力的SWE-Bench Verified测试里,准确率达到了81.4%,直接超过了Anthropic公司的Claude Sonnet ...
梁文锋是一名“80后”,17岁考入浙江大学信息与电子工程学系,在校期间深入研究数据分析和计算机系统,并对金融市场产生浓厚兴趣。2008年国际金融危机期间,梁文锋逆势而上,带领团队探索如何以先进的数学模型替代人为的主观判断,以更高速、更智能的计算机程序对市场进行分析,并作出理性的投资决策。 这种做法被称为量化交易。经济不断变化,算法有待完善,早期模型不断遭遇失败。但梁文锋的团队并不气馁,反复试错,不 ...
实际上,此前DeepSeek推迟R2发布时,即有分析称缺少英伟达芯片是原因之一。如果这种架构规模化铺开,英伟达的生态短期内会得到优势强化,国产芯片则需着力强化编译层的适配。而长期来看,供应mHC架构的AI芯片需要提升存储带宽,并转向更加精细化的设计。
今天下午,DeepSeek 官方正式发布 DeepSeek-V3.1。 相比于前天只在用户群里通知,今天新增了模型升级点、榜单成绩、model card,huggingface 上现在也可以下载模型文件了。 一共两个模型,分别是 V3.1 和 V3.1 base。两个模型结构完全一致,V3.1 的 Base 模型在 V3 的基础上 ...
DeepSeek Coder 是一系列由深度求索(DeepSeek)AI团队精心打造的先进代码大语言模型。它旨在深刻理解并高效生成代码,为开发者带来全新的编程体验。 如果你对AI如何辅助代码编写、自动生成代码片段、甚至解释复杂代码逻辑感到好奇,本教程将是你探索DeepSeek ...
在你已经初步体验过DeepSeek Coder并了解其基本交互方式后,本教程将带你深入探索更高级的使用技巧和应用策略。 掌握这些进阶方法,你将能更充分地发挥DeepSeek Coder的强大潜能,使其在复杂编程任务中助你一臂之力,显著提升开发效率和代码质量。 首先,我们 ...
仅是DeepSeek官方整理的“DeepSeek实用集成”名单,就有54款接入DeepSeek的应用,包括 24个应用程序、3个AI Agent框架、1个RAG框架、1个Solana框架、3个即时通讯插件、8个浏览器插件、2个VS ...
财中社2月11日电 甬兴证券发布通信行业点评报告。据IT之家1月20日消息,幻方量化旗下AI公司深度求索(DeepSeek)正式发布DeepSeek-R1模型,并同步开源模型权重。据官方介绍,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有少量标注数据的情况下,提升 ...
近日,深度求索(DeepSeek)旗下DeepSeek-R1、V3、Coder等全系列大模型正式接入国家超算互联网平台。据介绍,DeepSeek-R1专注于自然语言处理,具备强大的文本生成能力;DeepSeek-V3聚焦于图像生成,能够生成高分辨率和细节丰富的图像,适用于广告、艺术创作等多个 ...
我们是否即将迎来一场由相对的“弱势群体”驱动的AI革命?DeepSeek是一家成立于2023年的相对不为人知的中国初创公司,凭借其尖端的开源模型和低得惊人的推理成本,在全球AI界掀起了波澜。 尽管起步低调,但在新发布的DeepSeek R1模型的推动下,DeepSeek已经飙升 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果