首页财产ai正文 DeepSeek及国产算力下了好年夜一盘棋 2026年4月,DeepSeek发布V4系列预览版并开源两款模子,持续两晚降价,国产芯片厂商团体适配,财产闭环浮现,本钱市场反映强烈热闹。 2026-04-27 16:23 ·凤凰网Dale、姜凡 AI投资人解读· DeepSeek发布V4系列预览版并开源两款模子,持续两晚降价,V4-Flash每一百万tokens输入缓存掷中价格仅为0.02元,创下全世界年夜模子价格新低。V4于架构层面有三项要害立异,年夜幅降低计较与存储成本。8家国产AI芯片品牌完成对于DeepSeek-V4的适配,多家国产芯片企业事迹好转。 · 行业竞争激烈,技能更新换代快,可能致使市场份额不不变国产芯片企业研发投入年夜,可能面对资金压力。 总结:DeepSeek的技能立异与国产算力的适配成长,为AI运用市场带来新机缘,相干企业有望受益,但需存眷竞争及资金压力等危害。内容由AI天生,仅供参考
择要:
DeepSeek与国产算力协力,实现token成本的年夜幅降低后,又会反向利好AI运用市场,催生更年夜的市场空间。
0一、两天两次降价,效率成为了DeepSeek最深护城河
2026年4月的末了一个周末,中国AI财产被一连串动静完全点燃,而动静暗地里的主角只有一个,DeepSeek。
4月24日,DeepSeek正式发布V4系列预览版,同步开源Pro与Flash两款模子,均撑持百万token超长上下文。紧接着的25日与26日,DeepSeek持续两晚脱手降价——先是V4-Pro限时2.5折,再是全系API输入缓存掷中价格*降至首发价的十分之一。两天两次调价以后,V4-Flash每一百万tokens输入缓存掷中价格仅为0.02元,V4-Pro为0.025元,创下全世界年夜模子价格新低。

如许一场精心筹谋的霹雳战,暗地里是DeepSeek长达一年的艰巨求索。
但若依旧将眼光放于“价格战”的浅层叙事,就低估了DeepSeek此番脱手的深意。V4的降价已经经无关在烧钱换市场,其更年夜的意义是底层架构效率革命带来的成本变化。正如高盛Ronald Keung团队于最新研报中所指出的,“V4的焦点意义于在以更低成本撑持更繁杂的智能体运用落地,从而打开AI运用范围化的新空间”。
于DeepSeek-V4的技能陈诉里,效率是*的。
V4-Pro于100万token上下文场景下,单token推理所需浮点运算量仅为V3.2的27%,KV缓存占用仅为10%;V4-Flash更为激进——FLOPs降至10%,KV缓存压缩至7%。这象征着甚么?通俗地说,已往跑一条百万字上下文需要三台呆板的算力,此刻一台呆板就能自在应答,并且内存开消仅是已往的十分之一。
效率奔腾暗地里,有V4于架构层面的三项要害立异:混淆留意力机制(CSA/HCA)、流形约束超毗连(mHC),以和Muon优化器。此中最焦点的冲破于在混淆留意力——CSA(压缩稀少留意力)沿序列维度压缩KV缓存后履行稀少留意力计较,每一m个token的KV缓存被压缩为一笔记录;HCA(重度压缩留意力)则施加更激进的压缩计谋,将m'个token的KV缓存归并为单笔记录,但仍保留浓厚留意力。这套组合拳于险些不影响模子机能的条件下,将长上下文场景的计较与存储成本砍失了一个数目级。
更精妙的设计表现于细节处:对于KV条款采用混淆存储格局,扭转位置编码维度连结BF16精度,其余维度利用FP8精度,这一项便将KV缓存容量压缩近半。闪电索引器内部的留意力计较以FP4精度履行,进一步加快长上下文下的留意力运算。
技能压缩效率,效率兑现成本。这才是DeepSeek勇于持续降价的真正底牌。
理解了这一逻辑,便能看破这次降价的财产寄义:比拟在其他AI年夜模子降价冒死上桌,这一次DeepSeek直接用技能上风自动构建了成本壁垒。V4-Flash以0.02元/百万tokens的价格横扫市场暗地里,每一一分钱的降价都有底层架构优化作为支撑,而不是本钱烧钱补助的逻辑。竞争敌手要跟进,起首患上于技能上追平这份效率——而这显然不是一朝一夕之功。
0二、从模子等芯片,到芯片靠模子
与两次降价险些同步发生的,是国产芯片阵营的团体“起立”。
V4发布当日,华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股分、昆仑芯、平头哥真武、天数智芯8家国产AI芯片品牌,以和英伟达,均公布完成对于DeepSeek-V4的适配。特别值患上留意的是,这是年夜模子财产初次实现“Day 0”级另外全栈适配:模子发布即适配上线,芯片厂商再也不需要数月的“追赶式”调试周期。
这里有一个细节必需拆解清晰。DeepSeek官方于技能陈诉中暗示,“咱们于英伟达GPU及华为昇腾NPU两个平台上验证了细粒度EP(专家并行)方案,于通用推理使命中实现1.50至1.73倍加快;于延迟敏感场景下最高到达1.96倍”。这是DeepSeek汗青上初次将国产芯片与英伟达GPU并列写入硬件验证清单,确立对于等职位地方。
华为昇腾的反映也十分迅猛。昇腾官方于B站直播中称,于推理部署层面,昇腾950PR平台针对于V4实现了多项深度适配。量化方面,原生的硬件加快精度明确撑持MXFP8与MXFP4等低精度数据格局,统筹模子精度与内存占用优化。算子层面,华为官方公布昇腾950经由过程交融kernel与多流并行技能,年夜幅降低了混淆留意力机制的计较及访存开消,显著晋升了推理机能。而MoE模块中路由专家与同享专家的计较堆叠等深度优化,则进一步确保了万亿参数模子于国产硬件上的高效平稳运行。
寒武纪则于基在自研NeuWare软件生态与vLLM框架上,完成为了对于V4的“Day 0”适配并同步开源自研算子库。这已经是寒武纪持续第二次于DeepSeek新模子发布首日便推出适配方案,其技能迭代速率一样不容小觑。

更有说服力的旌旗灯号来自财政上的连续好转,国产开源年夜模子的极速成长,正于把中国算力财产拉入良性成长的通道里。
4月26日晚,摩尔线程发布2026年一季报:一季度业务收入7.38亿元,同比增加155.35%;归母净利润2935.92万元,同比扭亏为盈。这家被称为“中国英伟达”的国产GPU厂商,此前因研发投入高达营收86.68%而备受市场质疑,如今终究交出了一份逆转的答卷。与此同时,摩尔线程还有与某客户签署了金额达6.6亿元的夸娥智算集群发卖合同。
寒武纪此前发布的年度事迹快报亦显示已经率先实现盈利,沐曦股分则出现出吃亏连续收窄的态势。三家国产AI芯片代表企业同步进入事迹改善通道,已经经是十分有力的回应。
0三、国产算力生态临界点的到来
当DeepSeek的技能效率革命与国产芯片的产能开释于统一时间窗口交汇,一条完备的财产闭环最先浮出水面。
中银国际于4月26日发布的研报中判定:“DeepSeek V4的发布标记着国产年夜模子已经基本跑通全栈国产化,理论上已经形成从底层硬件、基础软件、平台办事到上层运用、安全系统的完备技能链条,国产算力板块或者迎来本身的质变临界点。”
反过来看,DeepSeek与国产算力实现协力,于年夜幅降低token成本后,又会反向利好AI运用市场,催生更年夜的市场空间。
据华泰证券表述,“市场轻易将V4理解为‘降本压低算力、存储需求’,但更主要的边际变化于在长上下文成本降落后,繁杂Agent、多文档阐发、长周期使命、于线进修等场景可用性晋升,推理挪用量与存储拜候频次有望扩张。”换句话说,降价不会缩减蛋糕,还有会做年夜蛋糕——越自制用患上越凶,总挪用量反而会暴增。
一样于4月24日,新版本OpenClaw发布,直接接入了最新的DeepSeek V4双版本,并将V4 Flash设置为了默许年夜模子。
据OpenRouter平台数据,DeepSeek V4flash今日挪用量较前一天上涨了62%。
值患上一提的是,DeepSeek已经明确将华为昇腾950超节点量产纳入其贸易路径,并预报下半年实现年夜范围供货后API订价将迎来显著降落。这象征着当前的降价可能只是一个预报,真实的主菜还有于后面。
本钱市场已经作出强烈热闹反映。4月27日早盘,A股算力芯片观点延续强势,CPU标的目的领涨,海光信息、摩尔线程等跟涨;港股半导体板块领涨,澜起科技涨超6%,中芯国际涨近5%。财产链上下流——从芯片设计到办事器整机,从算力租赁到AI运用——都于从头订价这一汗青性的财产变局。
这个4月,DeepSeek以一组硬核效率数据为矛、以两次精准降价为鼓,打出明牌——AI的长上下文时代已经经到来,而它的“高速公路”将由国产算力铺就。对于那些方才登岸科创板的国产芯片企业而言,这个春季确凿比往年都暖。
【本文由投资界互助伙伴凤凰网授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。
-k8凯发一触即发