
当大模子竞赛从“参数武备”转向“应用落地”,一个瞒哄而高增长的底层生意正在浮出水面——“Token工场”(把东谈主工智能才调拆解成最基础的计量单元“Token词元”,像自来水厂雷同按需供应)。
6月16日,国内AI(东谈主工智能)推理办事企业“硅基流动”官宣完成超20亿元B轮融资,创下2026年以来国内第三方MaaS(模子即办事)赛谈最大单笔融资记录。《逐日经济新闻》记者了解到,这家修复不及三年的企业,往时一年日均Token隐约量达数万亿量级,营收同比涨超十倍,还曾在11个月内连获三轮融资,成为一级阛阓炙手可热的场合。
无专有偶,5月,同赛谈企业无问芯穹、魔形智能纷繁文告融资。其中,无问芯穹再获超7亿元融资,累计融资额超22亿元。限度4月底,无问芯穹AgenticMaaS大模子办事平台的日均Token调用量相较于旧年底已增长超20倍。
成本狂热加码的另一面,头部互联网大厂全面落地自研推理算力与MaaS办事、全行业API(应用标准编程接口)订价堕入尖锐化竞争、端侧轻量化模子合手续分流云表Token调用需求。多重挤压之下,“Token工场”广大堕入业务限制高速膨大、盈利空间握住收窄的矛盾景观,若何走出增收不增利的困局成为赛谈中枢议题。

产业成本扎堆入局“Token工场”
成AI落地中枢赛谈
一笔20亿元级融资,将“Token工场”赛谈再次推至聚光灯下。
2026世界杯赛事竞猜中国官网据硅基流动官方泄漏,本轮融资由携程战投、晶科动力控股、金蝶股份、联通新沃、盛奕成本(滋润集团产业成本)、壁仞战投、蔚来成本、商汤战投、巨东谈主收集等二十余家机构聚合投资。至此,硅基流动已赢得动力、芯片、算力基础设施、云办事、大模子及场景应用等AI全产业链企业投资,产业成本在本轮融资中占比权贵晋升。
这并非赛谈首笔大额融资。本年5月,同赛谈玩家无问芯穹刚完成超7亿元融资;国外阛阓中,FireworksAI修复四年运筹帷幄估值达150亿好意思元,日处理Token限制15万亿。短短一年时期,“Token工场”已从AI产业链角落举止,跃升为一级阛阓的中枢赛谈。
成本热捧的底层逻辑,是AI需求结构的根人性切换。
大模子才调每迈上一个台阶,就解锁一大类应用,应用反过来又晋升了底层Token耗尽量。据国度数据局相关数据,2024年头中国日均Token调用量为1000亿;至2025年底跃升至100万亿;本年3月已攻击140万亿,两年增长超千倍。
民众知名有计划机构IDC最新发布的《中国AI软件阛阓半年度跟踪,2025H2》数据露出:2024年中国企业级MaaS阛阓调用量仅114万亿Token,2025年跃升至1944万亿Token,同比增长约16倍;2025年公有云MaaS阛阓限制达30.7亿元,增速远超AI行业举座水平。Agent智能体普及、多模态应用落地、行业数字化转型三大趋势,仍在合手续推高Token耗尽限制。
IDC预测,2026年中国MaaS阛阓的Token耗尽量将达到40000万亿,较2025年再增约20倍。
从交易口头本体来看,Token工场并非概况的算力转售,中枢是将芯片适配、模子部署、推理引擎调优、异构算力转变等复杂工程才调,牛牛游戏中国2026世界杯官网封装为标准化API接口。客户按需调用、按量付费,省去了企业自建集群、组建运维团队的重参加,大幅裁减了AI落地的期间门槛与成本周期。
面对海量的阛阓需求爆发,大限制、高性价比Token的踏实供应,正成为影响AI期间限制化落地的要害才调。
天神投资东谈主、资深东谈主工智强各人郭涛领受《逐日经济新闻》记者采访时暗示,从“卖模子”到“卖Token”是AI产业交易化的迫切演进。Token看成大模子处理信息的最小单元,具备可计量、可订价、可交游的本性,将AI智能才调转折为可标准化交游的巨额商品,措置了AI才调难以量化的行业痛点,鼓励行业从定制化办事口头转向标准化、限制化变现口头,耐久来看这门生意具备较好的可合手续性。
中金公司研报露出,“Token工场”口头已成为民众大模子厂商的主流交易化旅途,国外头部企业Anthropic年度经常性收入攻击300亿好意思元。盈利层面,面前国外头部大模子API业务毛利率广大在40%至50%,国内大模子厂商MaaSAPI业务毛利略低于国外,预测本年将达到20%至40%,跟着限制效应开释与期间优化,耐久仍有上行空间。

大厂下场、API价钱战尖锐化⋯⋯
“Token工场”盈利承压
不外,头部企业营收十倍增长的亮眼数据背后,赛谈隐忧耐久存在。跟着互联网大厂下场布局、API价钱战尖锐化,“Token工场”的交易口头范围与增长天花板正被重新凝视。
大厂躬行下场是最径直的行业变量。
6月8日,亚搏yabo(中国)阿里巴巴文告组织架构调理,将通义大模子行状部与畴昔生活实验室整合,修复全新TokenFoundry行状部,由集团CEO(首席实践官)吴泳铭径直崇敬。此前3月,阿里修复ATH(AlibabaTokenHub)行状群,还是喊出了“创造Token、运送Token、应用Token”的中枢运筹帷幄。
将Token坐蓐晋升至集团策略级,背后是大厂对推理办事进口价值的重估:Token产能既是提拔本人电商、云办事、土产货生活等业务AI化的基础,亦然阿里云对外输出MaaS办事的中枢产能。
郭涛以为,大厂全面入场后,零丁第三方“Token工场”仍有活命空间。他向记者暗示,大厂虽有期间、资源和生态上风,但阛阓需求千般且复杂,难以狡饰通盘领域和场景。零丁第三方可聚焦特定垂直领域提供个性化、定制化办事,或深耕特定期间优化,针对某类模子或场景晋升Token生成后果与质料。此外,部分企业出于数据安全、幸免过度依赖单一厂商的考量,也会选拔与零丁第三方合营。
API价钱战合手续尖锐化,则是面前“Token工场们”面对的最径直盈利压力。
自2023年以来,头部大模子厂商已累计十余次下调API价钱,部分主流模子千Token价钱从领先的数毛钱降至几分钱,累计降幅超90%。穷乏中枢优化才调、仅靠算力差价盈利的中间商型玩家已率先堕入赔本。
本年5月,DeepSeek官方文告V4-Pro模子API永远降价,举座降幅75%,百万Token输出价钱为6元。随后,小米、腾讯云纷繁跟进,小米旗下MiMo-V2.5系列API永远降价,最高降幅达99%,Pro版订价与DeepSeekV4-Pro整个对都。腾讯云自6月3日0时起,对DeepSeek-V4系列模子调用价钱进行大幅下调,最高降幅达到97.5%,调理后价钱全面合手平DeepSeek官方售价。
业内广大以为,若“Token工场”后果晋升的速率跟不上价钱下落速率,交易口头的可合手续性将径直面对挑战。
此外,端侧AI的快速普及,则从需求端分流阛阓。随入部下手机、PC(个东谈主电脑)等末端开拓的端侧大模子才调升级,大都轻量级推理任务向端侧移动,无需调用云表Token。行业广大预测,畴昔30%至50%的推理需求将在端侧完成,尽管高复杂度、多模态、长高下文的中枢推理需求仍依赖云表,但端侧分流无疑收窄了云表“Token工场”的举座增长天花板。
与此同期,头部客户自建推理集群的趋势也在蚕食第三方阛阓份额。金融、动力、政务等数据敏锐型行业出于合规考量,更倾向私有化部署;头部互联网企业跟着业务限制扩大,自建算力集群的单元成本已低于第三方采购,纷繁转向自建。第三方“Token工场”的中枢客群,可能冉冉向中小企业、长尾应用与弹性需求场景辘集,阛阓定位面对重构。
关于“Token工场”赛谈的泡沫争议,郭涛向记者暗示,现在阛阓如实存在一定泡沫迹象。大都成本涌入下,部分企业为追求限制盲目膨大,忽视践诺成本与盈利情况。但举座而言,AI发展是势在必行,Token经济看成其交易化要害口头有着真确需求提拔,仅仅阛阓需要阅历调理与整合。
谈及破局旅途与行业终局,郭涛以为,“Token工场”可通过晋升算力诓骗后果、优化能耗裁减运营成本,通过分级服求完毕各异化订价获取溢价,还可配套模子优化忽视、期间支合手等升值办事拓展收入开首。
“耐久来看,阛阓更可能酿成多脉络、各异化的竞争面容:头部大厂凭借实力占据通用型大限制阛阓,中小‘Token工场’凭借特质办事深耕细分领域,酿成错位竞争,共同组成多元的阛阓生态。”郭涛暗示。
记者|赵雯琪
剪辑|张锦河余婷婷杜恒峰
校对|程鹏亚搏体育