DeepSeek新模型曝光:MODEL1代码预示新架构,最快有望2月发布
发布时间:2026-02-21 14:50:19 作者:au 点击:3211 【 字体:大 中 小 】
IT之家 1 月 21 日消息,新模型曝新架The 光M构最Information 月初爆料称,DeepSeek 将在今年 2 月中旬农历新年期间推出新一代旗舰 AI 模型 ——DeepSeek V4,代码将具备更强的预示写代码能力。
1 月 20 日,望月正值 DeepSeek-R1 发布一周年之际,发布有开发者发现 DeepSeek 在 GitHub 中更新了一系列 FlashMLA 代码,新模型曝新架横跨 114 个文件中有 28 处都提到了未知的光M构最“MODEL1”大模型标识符。
![]()
该标识符与已知的现有模型“V32”(即 DeepSeek-V3.2)被并列或区别提及。根据代码上下文分析,预示“MODEL1”很可能代表一个不同于现有架构的望月新模型。
开发者分析认为,发布“MODEL1”与“V32”在关键技术上存在区别,新模型曝新架主要体现在键值(KV)缓存的光M构最布局、稀疏性处理方式以及对 FP8 数据格式的代码解码支持等方面。这些差异表明新架构可能在内存优化和计算效率上进行了针对性设计。
此前,DeepSeek 研究团队还陆续发布了两篇技术论文,分别介绍了名为“优化残差连接(mHC)”的新训练方法,以及一种受生物学启发的“AI 记忆模块(Engram)”。这一举动不禁引起用户猜测,DeepSeek 正在开发中的新模型有可能会整合这些最新的研究成果。敬请期待。
猜你喜欢
NBA最朴素的球员,自己组装电脑,一双球鞋穿三年!
1136
重庆:一季度立案1061件处分846人 其中厅局级9人
352
安徽芜湖查处“乐天玛特”超市非法设台
1070
中国省域经济综合竞争力排名:重庆上升幅度最大
1345
解放中场,他的搭档成曼联第一目标
1231
青海省通报4起侵害群众利益的不正之风和腐败问题
2898
涉案金额3.7亿!重庆海关破获最大宗奢侈品走私案
335
人民日报刊文赞相声《新虎口遐想》:惩恶扬善
2620
豪取6连胜!谁说哈登防守差?阿特金森不满发声,阿伦也把话挑明
789
民航网信安全管理:不得收集与服务无关旅客信息
1951
青海2016年办结扶贫领域涉违纪信访举报734件
1688
《互联网信息内容管理行政执法程序规定》全文内容发布
1557 官方:波普因接受手术矫正右手小指错位,将缺席剩余全部比赛
2016年全国检察机关批捕电信诈骗犯罪19345人
“中国的路子走对了”——国际人士热议供给侧结构性改革
光明网:官员个人事项就该“真报真核”,有问题不能止于降职
美国大魔王领奖时站C位,工作人员要求他退后,并请宁忠岩站到C位
湖南:十八大以来立案查处纪检监察干部695人
宁夏约谈8家落实八项规定精神不到位单位党政“一把手”
反腐电视剧《国家行动》2017年播出时间 央视上映
休媒纷纷发声为KD点赞:决胜10分挑大梁 火箭又啃老 斯通换他赢麻
北京法院健全制度机制 司法人员违法干预办案可全程留痕
银行业要为一带一路建设铺路搭桥——访银监会副主席王兆星
毕井泉谈规范中成药命名:有些存在夸大和暗示疗效
短道速滑女子1500米1/4决赛分组:中国三将出战,舒尔廷回归
海南:2016年开展谈话提醒7684人次 省部级44人次
中纪委机关报:“长大当贪官”非童言无忌,反腐要从孩子抓起
广西:7个巡视组对14个单位开展巡视 公布电话邮箱
海港边后卫加盟一年即离队 再回故乡获官宣 无缘亚冠已成离开迹象
北京市纪检机关前两月接受有效信访举报2381件(次)
北京:2017年1至2月处分317人 厅局级6人
更加有力捍卫公平正义——代表委员审议讨论两高报告
魔鬼赛程!4个对手都强!加兰复出或推迟到3月,小卡苦撑难进前8
中纪委机关报:“长大当贪官”非童言无忌,反腐要从孩子抓起
老公失联十几天急坏老婆 竟是躲在网吧上网
中纪委机关报:“长大当贪官”非童言无忌,反腐要从孩子抓起
