硅谷掀起新一轮GPU“断供潮” 初创企业算力告急
微软、亚马逊等云巨头正将英伟达GPU优先分配给内部团队及头部客户,导致中小AI初创企业面临算力资源短缺问题。据The Information报道,此轮供应紧缺已影响到多家获得红杉资本、Founders Fund、General Catalyst及Andreessen Horowitz等顶级机构支持的AI初创公司。General Catalyst管理合伙人Hemant Taneja向其投资组合创始人发出调查问卷,询问算力获取情况,并表示算力尤其是GPU访问是今年面临的最大瓶颈之一。
供应紧张推高了租用价格,云服务商的利润率因此提升,但初创企业的运营成本也随之大幅攀升。微软Azure已告知内部员工,客户应预期漫长的等待时间至少将持续至2026年底,这深刻影响着整个AI创业生态。
当前GPU短缺与2023年初的情形相似,当时云服务商同样从云服务中抽调算力,优先支持内部团队及OpenAI等核心客户。然而,现在的情况更为严峻。AI编程工具的需求激增以及大型AI开发商对算力的需求增加,进一步挤压了中小客户的空间。此外,大量AI初创企业此前签订的两至三年云服务合同到期后,云服务商趁机提高价格或重新分配算力给出价更高的买家。
微软的算力分配机制已形成清晰的等级体系。Azure将客户分为三个层级:约1000家云支出最高的大客户享有优先访问权;次之的是配有专属销售代表的客户;规模较小的企业则由微软经销商合作伙伴管理。微软要求希望获得英伟达Blackwell芯片的客户至少承诺租用1000块芯片,期限不低于一年,合同金额至少达数千万美元。即便是租用旧一代英伟达芯片,客户也需等待数周乃至数月。微软还实施“用进废退”政策热点话题,追踪按需付费客户的使用率,一旦服务器闲置数小时,便可能撤销其访问权限。
图像生成AI初创公司Krea的经历颇具代表性。该公司六个月前以每小时每块芯片2.80美元的价格签下了数百块英伟达Blackwell芯片的六个月合同,但近期寻求更多服务器时,局面急转直下。部分云服务商的销售代表不接电话,即使回电也告知价格大幅上涨,并要求签订三年期合同。最终,Krea以每小时3.70美元的价格签下一年期合同,较上次价格上涨32%。另一家寻求租用近1000块GPU紧密集群的初创企业被告知,该集群每日租金将超过7万美元。硅谷掀起新一轮GPU“断供潮” 初创企业算力告急