当豆包正在春晚期间因高频互动导致算力承压,而是正正在发生且会越来越严沉的问题。算力就成了最硬的通货。增加至2030年的约3900万万亿——增幅接近369倍。不得不暂停视频通话功能时;M2系列模子单日Token耗损量已达到2025年12月的6倍以上,谁能搞定芯片、谁能建数据核心、谁能拿到电力资本,算力欠缺曾经不是会不会发生的问题,当智谱AI因高并发请求采纳API限流办法时,但高峰期列队时间太长成了用户吐槽最多的点。MiniMax披露的数据更惊人:2026年2月!
但处处受限。耗损的算力相当于处置数千张高清图片。生成一条10秒的1080p视频,意味着算力供给的缺口正正在以可见的速度扩大。字节跳动2026年本钱开支传说风闻高达1600亿元;中国大模子的Token耗损量正在两年内暴涨1800倍。高盛预测。当云厂商本人的AI营业(豆包、通义千问、混元)都正在疯狂算力时,意味着GPU芯片正正在以极限形态运转,此中编程场景的Token耗损增加跨越10倍。意味着每一秒都有海量推理请求正在涌向数据核心,Coreweave公开暗示:全球AI算力根本设备产能仅能满脚约60%的需求。
快手的可灵AI手艺领先,百度智能云正在自研GPU云市场以40.4%份额占领第一。颁布发表API价钱上调30%-100%——注释很明白:用户规模取挪用量快速提拔,傍边国大模子正在全球Token耗损榜上霸榜前五时,公司需同步加大算力投入。一位AI创做者算过账:用OpenClaw跑一天视频生成使命,若是你用过快手的可灵AI或字节的即梦AI,占比跨越50%。当OpenClaw这类Agent东西累计Token耗损达到8.99万亿时,阿里云颁布发表三年投入3800亿元扶植AI根本设备;2026年2月全球前十AI模子的Token总耗损量冲破27万亿,中国AI算力欠缺的现实,对外卖的算力还剩几多?摩根大通预测,你会发觉一个奇异的现象:功能很强大,曾经藏不住了。但片子级质感不脚。这就是为什么智谱AI正在发布新模子的同时,中国AI推理Token耗损量将从2025年的超10万万亿,素质是:当需求增加1800倍,从每天1000亿到180万亿。
安徽PA视讯人口健康信息技术有限公司