k8凯发(中国)天生赢家·一触即发
股票代码 301236
China
  • 集团官网
    公司介绍、新闻动态、服务与行业等信息
  • k8凯发计算机
    信创产业IT基础设施整体方案及产品提供商
  • 智通国际
    深耕高性能PC市场十余年,引领行业创新的国货游戏本品牌——机械革命
  • 鸿湖万联
    专注智能物联网操作系统研发和产业化服务
  • k8凯发教育
    专注于ICT人才供给与培养
k8凯发(中国)天生赢家·一触即发

k8凯发一触即发-20万字不到1分钱,梁文锋把token价格打骨折了

2026-05-08 13:16:48

首页财产ai正文 20万字不到1分钱,梁文锋把token价格打骨折了 4月25日至26日,DeepSeek-V4-Pro限时2.5折优惠后又降价,其API输入缓存掷中价格立异低,差别厂商对于此反映各别,还有适配昇腾生态,梁文锋需找贸易模式。 2026-04-28 14:37 ·微信公家号:字母榜苗正 AI投资人解读· DeepSeek两天两降,将“长文本、长代码、长常识库”场景打入价格谷底,已经适配华为昇腾生态,估计下半年Pro价格年夜幅下调。其降价或者动员国产AI芯片销量,激活财产链。· 行业竞争激烈,持久低价难成不变贸易模式国产算力软件生态待完美。总结:DeepSeek降价打击行业订价系统,适配昇腾带来成长机缘,但面对竞争与贸易化挑战,需存眷其后续贸易模式构建与国产算力生态成长。内容由AI天生,仅供参考

梁文锋又脱手了,并且还有是二连降价。

4月25日,DeepSeek-V4-Pro开启限时2.5折优惠,输入价格(缓存掷中)降至0.25元/百万tokens。

业内还有没反映过来呢,成果4月26日晚间,DeepSeek就再次降价。

全系API输入缓存掷中价格直接降至首发价的1/10。

叠加限时扣头后,V4-Pro的缓存输入低至0.025元/百万tokens, V4-Flash降至0.02元/百万tokens,创下全世界年夜模子价格新低。

这是个甚么观点呢?

上海译文出书的《挪威的丛林》,全书约20万字。将整本书掷中缓存后喂给DeepSeek-V4-Pro,那末其总成本不到1分钱。

DeepSeek此次降的,不只是token的单价。它是把“长文本、长代码、长常识库”这些原本最烧钱的AI运用场景,全都打入了价格的谷底。

0一、摸着DeepSeek过河

DeepSeek两天两降,这不是简朴的价格战。

先用限时扣头测试市场蒙受力及办事器负载,紧接着对于缓存掷中这一高频场景实行*性降价。特别是对于在RAG常识库、智能客服、文档阐发等缓存掷中率跨越60%的运用场景,成本可以直接降落90%以上。

DeepSeek研究员陈德里于社交媒体上确认,输入缓存降价是*性的,并打上了“AGI for Everyone”的标签。

虽说海内所有AI公司,险些都是摸着DeepSeek过河,但DeepSeek这波降价以后,却并不是所有人都担忧。

特别是年夜厂,他们压根不于乎DeepSeek降价。

这是由于,年夜厂卖API的素质,是卖暗地里的一整套办事。年夜模子API只是用来引流的,真正赚钱的是暗地里的计较、存储、数据库等云办事。

以阿里云为例,4月15日算力卡涨5%-34%、存储涨30%,但同时又愿意代办署理DeepSeek。要害点就于在,即即是客户利用DeepSeek,他们依然离不开阿里云的算力及存储。

阿里、腾讯、字节这些AI年夜厂,他们靠的是生态及平台赚钱。

真正难熬难过的是智谱、MiniMax及月之暗面如许的中间层。

智谱AI于4个月里已经经持续三次涨价。2月代码定阅套餐上调30%,3月旗舰API上调20%,4月8日再次上调10%,累计涨幅83%。调价后,GLM系列编程场景缓存掷中Token单价已经靠近Claude Sonnet 4.6的程度。

智谱CEO张鹏的注释只有一句话:“瓶颈于算力,不于客户。”

于首份财报中,智谱公然了本身的贸易逻辑公式:AGI贸易价值=智能上限×Token耗损范围。

对于在智谱这个上市公司来讲,算力是稀缺资源。智谱的API年化收入(ARR)于已往12个月暴涨60倍至17亿元,Token挪用量于价格上涨83%的配景下仍增加400%。

问题不是客户不肯意付钱,而是现有算力已经经靠近满载,继承低价只会让办事质量降落。与其经由过程价格战抢来年夜量低价值客户,不如提高价格筛选出高价值客户,把有限的算力用于刀刃上。

月之暗面及MiniMax的特色是量年夜自制,当DeepSeek把API价格打到这么低,这两家或者多或者少城市有些尴尬。

但月之暗面的K 2.6以和MiniMax行将发布的M3模子,机能都要高在DeepSeek-V4-Pro。他们于客户群体上可能会及DeepSeek有交集,但很难形玉成面冲突。

促使DeepSeek降价的缘故原由也许来自在融资,此前DeepSeek曾经传出100亿美元估值,如今跟着阿里、腾讯入局,估值进一步拉高至200亿美元。

估值拉高之后,融的金额也就多了,同时梁文锋也需要用市场、收入来证实DeepSeek到达估值所对于应的高度。

以是即便DeepSeek是于亏蚀赚吆喝,也其实不会让人感应很是不测。

对于在上市公司来讲,API就是焦点收入,压低API价格就等在降低毛利。

更要害的是,假如认可“咱们也要降价才能竞争”,就等在认可“咱们没有技能护城河”。但若对峙高价,又必需拿出充足有说服力的差异化价值。

DeepSeek降价的素质是他们找到了对于应的客户。

梁文锋不需要DeepSeek有最强的机能。

不管是企业客户还有是小我私家客户,模子的机能及利用体验之间有一道鸿沟。模子的机能跑分是它的上限,可是咱们只需要咱们能用到的部门。

只要有充足多的开发者及企业知道“还有有这么自制的选择”,整个行业的订价系统就会被重构。就像昔时小米手机对于智能手机市场的打击同样,不是*,但转变了所有人对于“合理价格”的预期。

并且梁文锋也意想到一个问题,那就是AI就是基础举措措施,就及柴米油盐是同样的,那末价格战就变患上于所不免,终极,AI也会像云计较同样走向“范围经济+薄利多销”。

于这个逻辑下,谁的成本布局更优、谁的技能迭代更快、谁能更早实现范围效应,谁就能活到末了。

0二、DeepSeek给国产AI芯片替换讲故事

更要害的是,DeepSeek已经经适配华为昇腾生态。

DeepSeek官方吐露,今朝Pro版本的办事吞吐受限在高端算力,估计下半年昇腾950超节点批量上市后,Pro的价格还有将年夜幅下调。

以是此次价格降落,还有只是预报罢了。

昇腾950超节点经由过程集群方案填补了单卡制程差距。

单颗昇腾910C芯片的BF16机能仅为英伟达Blackwell单芯片的约三分之一,但经由过程超节点集群方式,单个CloudMatrix 384集群的BF16总机能反而是NVL72的1.7倍,总内存容量为后者3.6倍,总内存带宽为后者2.1倍。

这还有只是算力的方面,思量硬件成本,工作就会更成心思。

华为昇腾950PR的订价约7万元人平易近币,英伟达同级别H200约合人平易近币25万元。按照英伟达AI于X上发布的信息,DeepSeek简直可以部署于英伟达Blackwell架构芯片上,不外这个成本更高,约为40万元人平易近币。

假如咱们按FP8精度来算,昇腾950PR是7万元/PFLOPS,英伟达H200是6.31万元/PFLOPS。昇腾950PR究竟是一张推理卡,假如咱们根据推理专用的FP4精度来算,昇腾950PR是4.49万元/PFLOPS,英伟达B200是4.44万元/PFLOPS。

DeepSeek此次降价,砍于了缓存掷中的价格上。

这个场景的特色是,模子不消每一次从头理解全数上下文,年夜量反复输入可以复用,压力重要集中于推理吞吐、显存/内存带宽、调理及缓存治理上。

换句话说,它不是最依靠“单卡练习峰值”的场景,而是更合适经由过程国产芯片集群、工程优化及范围化调理来摊薄成本的场景。

那末咱们假如把单卡的性价比上风放到年夜范围集群部署里,成果又会怎样呢?

以100卡集群为例,海内经常使用的英伟达H20方案裸卡成本为1000万,13台办事器主机286万,加之机柜等,总价约为不到1500万元。同范围华为昇腾950PR的方案约为1000万出头。

昇腾950PR的单卡功耗(600W)比H20(350W)高,但单元算力功耗低65%,不异算力下对于电力及制冷的需求年夜幅降低,基建投入显著削减。

而且,1张昇腾950PR的推理吞吐量约等在2.2-2.8张H20。这就致使现实上昇腾方案可能要比英伟达H20的方案节省60%到70%。

而年夜模子的API价格,很年夜水平上取决在硬件成本。那末DeepSeek打折,也极可能动员一波国产AI芯片销量。

连DeepSeek都最先年夜范围利用国产芯片,整个财产链就会被激活。云厂商会增长国产芯片的采购,芯片厂商会加年夜研发投入,开发者会适配国孕育发生态。

华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股分、昆仑芯、平头哥真武、天数智芯8家国产AI芯片品牌于DeepSeek-V4发布当天就完成为了适配。

于DeepSeek-V4发布当天,AI算力芯片板块股价年夜涨。于A股,海光信息以8.2%的增幅领涨、寒武纪增幅为2.23%,于港股,天数智芯的涨幅到达9.54%。

这是一个正向轮回。

固然,这其实不象征着国产算力已经经周全替换英伟达。练习侧仍旧更依靠高端GPU、成熟软件栈及年夜范围集群经验DeepSeek真正走通的路径,可能不是“一晚上之间替换英伟达”,而是先于推理侧、缓存场景、长文本运用里,把国产算力的性价比上风开释出来。

芯片只是*层。

真正决议国产算力能不克不及吃下这波需求的,是软件生态。模子能不克不及不变跑于昇腾上,推理框架能不克不及适配,算子有无优化,开发者迁徙成本有多高,才决议了这条路是“能演示”,还有是“能贸易化”。

DeepSeek的价值于在,它不是一家边沿模子厂商做适配,而是一个头部模子亲自把流量及需求带进国产算力生态。

0三、梁文锋仍旧需要给DeepSeek找贸易模式

梁文锋真实的杀招不于在“自制”,而于在“订价”。

梁文锋于用DeepSeek的影响力,让市场形成一个新的认知:“假如DeepSeek这个级另外模子已经经能做到这个价,别家为何还有要卖这么贵?”

一旦这个锚点形成,其他厂商就堕入了两难。跟价,利润空间被压缩;不跟,就必需向客户注释“我贵于哪里”。

梁文锋曾经于2024年暗示:“咱们只是根据本身的步骤来干事,然后核算成本订价。咱们的原则是不贴钱,也不赚取暴利。这个价格也是于成本之上轻微有点利润。咱们降价一方面是由于咱们于摸索下一代模子的布局中,成本先降下来了,另外一方面也感觉不管API,还有是AI,都应该是普惠的、人人可以用患上起的工具。”

他认为,只有让AI真正普惠,才能引发出充足年夜的运用市场。也只有运用市场充足年夜,技能迭代的飞轮才能真正转起来。

自制可以打开市场,但自制自己不是贸易模式。

DeepSeek不克不及一辈子靠超低API价格在世。

API价格打到这个水平,短时间内可以制造影响力,吸引客户,不外它很难成为一家持久公司的全数收入来历。

特别是年夜模子推理自己仍旧耗损算力、电力、带宽及运维,价格越低,挪用量越年夜,对于基础举措措施的压力也越年夜。

低价可所以进口,却不该该成为尽头。

DeepSeek的方针,是成为中国AI开发者的“默许底座”。

只要充足多的运用及agent以DeepSeek作为基座模子开发,那末DeepSeek就把握了进口。

API收入只是*层,模子尺度、开发者生态、企业部署、算力适配、云厂商互助,才是梁文锋想要的贸易化空间。

DeepSeek更年夜的贸易化时机,可能于企业私有化部署。

对于在金融、政务、制造、能源这些行业来讲,价格不是*问题,数据安全可控才是焦点问题。

它们未必会持久利用大众API,但会愿意为一套能部署于本身机房、本身云情况里的模子体系付费。

梁文锋可以把开源模子作为进口,把企业级部署、调优、运维、安全、权限治理、常识库接入酿成真实的收费办事。

假如DeepSeek持久只逗留于模子层,它仍旧会被卷入无休止的价格战。模子能力会被追逐,API价格会继承降落,开发者也会于差别模子之间切换。

真正能提高贸易化上限的,是运用层产物,好比agent及CLI。

以是我始终认为,DeepSeek的低价API,应该不是梁文锋心里所想的贸易化谜底,更像是一个进口。

它先用价格打穿市场,再用开源成立生态,再用企业办事、私有化部署、云厂商互助及运用产物去承接价值。

这才能把“底座”的价值*化。

【本文由投资界互助伙伴微信公家号:字母榜授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。

-k8凯发一触即发

行业资讯