当前位置: 首页 > 资讯攻略 > IT资讯 > 告别通用算力 谷歌为什么要做算力专属化?

告别通用算力 谷歌为什么要做算力专属化?

来源:互联网 分类:IT资讯 发布时间:2026-04-24 16:56:13 访问量:

近日,谷歌在Cloud Next 2026大会上发布第八代TPU,首次将训练与推理任务拆分为两款独立芯片——TPU 8t专攻大规模训练,TPU 8i专司高效推理。这一"训推分离"的硬件设计,标志着谷歌在算力专属化道路上迈出了最彻底的一步,引发了业界对AI算力未来发展方向的深度思考。

告别通用算力 谷歌为什么要做算力专属化?谷歌TPU 8i

过去十年,英伟达GPU凭借通用性与CUDA生态几乎垄断AI算力市场,成为全球AI发展的核心驱动力。然而,谷歌却始终坚持从零开始自研TPU,从2015年内部部署到如今全面对外服务,走了一条截然不同的技术路线,展现了其在AI基础设施领域的长期战略眼光。

如今,推理需求即将占据AI总算力的70%以上,行业正站在算力范式的拐点。从聊天机器人到AI代理再到数字员工,每一次应用跃迁都意味着推理负载的指数级增长。与此同时,微软、亚马逊、Meta纷纷入局自研芯片,AI算力市场正从单极走向多极。

那么,谷歌为何选择走算力专属化这条路?

从通用到专用

谷歌将TPU拆分为训练与推理两款独立芯片,根本驱动力来自AI计算需求的结构性转变。巴克莱预测,到2026年推理计算需求将占AI总算力的70%以上,是训练需求的4.5倍,市场规模达1450亿美元,正式取代训练芯片成为行业核心引擎。

告别通用算力 谷歌为什么要做算力专属化?谷歌TPU 8i

德勤同期报告指出,2026年全球AI算力芯片市场突破2800亿美元,推理芯片需求首次超越训练芯片。巴克莱预计2028年英伟达推理芯片份额将从目前的80%降至约50%,主要原因是云服务商推出定制ASIC芯片以提升推理市场占有率。

进入AI代理时代后,推理需求进一步激增。巴克莱将AI发展分为三个阶段:当前“聊天机器人时代”,2025-2026年“AI代理时代”,以及2027年后“数字员工时代”。代理时代中,AI智能体使单交互Token消耗暴增20-30倍,多步骤推理需求呈指数级增长。

在此背景下,通用GPU的局限日益突出。其数千个并行计算单元和复杂内存调度在训练时是优势,在推理时却造成不可预测的延迟抖动。谷歌Amin Vahdat明确指出:“随着AI智能体的兴起,我们认定针对训练和推理分别提供专门优化的芯片,将使整个技术生态受益。”

挣脱“英伟达枷锁”

算力专属化的另一重动力,来自科技巨头对英伟达供应链依赖的深度焦虑。目前英伟达控制着全球约85%至92%的AI加速器市场,2026财年数据中心营收达2159亿美元,毛利率高达73.6%,其市场地位近乎垄断。

告别通用算力 谷歌为什么要做算力专属化?英伟达

英伟达的护城河不仅在于硬件,更在于CUDA软件生态系统。经过二十余年积累,CUDA已拥有超过400万注册开发者。面对高昂采购成本和供应短缺风险,全球最大的几家云服务商纷纷投身自研芯片。

这一趋势已从谷歌一家扩展为全行业共识。2026年1月,微软发布第二代自研AI芯片Maia 200,采用3纳米制程。Meta在2026年4月宣布与博通合作研发MTIA定制加速器。亚马逊CEO安迪·贾西透露Trainium需求进入爆发期,Trainium 3计划于2026年初出货。

从资本支出来看,TrendForce预估2026年全球八大CSP合计资本支出超7100亿美元,年增约61%。其中Alphabet资本支出有望超1783亿美元,年增95%。谷歌是各CSP中唯一ASIC出货比例高于GPU的业者,预计2026年TPU在其AI服务器中占比将逼近78%。

算力专属化带来了什么

谷歌算力专属化战略本质上是对AI时代算力权力格局的一次主动重构——从依赖第三方通用算力,转向深度定制、软硬协同的专用算力体系。这一转型的价值体现在三个层面。

告别通用算力 谷歌为什么要做算力专属化?

首先是性能效率的直接提升。TPU 8t在同等价格下效能较上一代提升2.8倍,每瓦性能提升124%;TPU 8i效能提升80%,每瓦性能提升117%。两款芯片均整合基于安谋架构的Axion CPU,消除数据预处理延迟瓶颈,确保TPU持续满载运转。

其次是成本效益的显著优势。谷歌借助TPU大幅压缩大模型部署成本,将Gemini等产品的使用成本压低至极具竞争力的水平。投资银行D.A. Davidson估算,谷歌TPU业务加上DeepMind的总价值约为9000亿美元,接近谷歌总市值约4万亿美元的四分之一。

第三是软件生态的自主构建。CUDA生态覆盖全球超过95%的AI开发者,被视为最难撼动的壁垒。谷歌启动“TorchTPU”计划,与Meta合作让TPU顺畅运行PyTorch。第八代TPU现已支持JAX、PyTorch、Keras等主流框架,开发者可直接迁移模型而无需修改代码。

从宏观视角看,算力专属化正在重塑云服务市场的基础逻辑。TrendForce指出,业者正日益扩大导入ASIC基础设施,以确保AI应用服务的适用性及数据中心建置的成本效益。能够自主掌控从芯片到框架、从训练到推理全流程的厂商,将在AI竞赛中获得长期核心优势。

总结

英伟达凭借CUDA生态和通用GPU确立了一个时代的算力话语权,但AI工作负载的分化正在打破这一格局。推理不再是训练的“配角”,而是独立成为算力需求的主力,这对芯片架构提出了崭新的要求。科技巨头已无法承受唯一供应商的锁定风险,自研芯片成为降低成本和分散风险的唯一出路。

在这场算力重构的大潮中,谷歌凭借十年TPU积累和第八代芯片的战略转向,正从一个算力使用者转变为算力定义者。CNMO认为,算力专属化在未来将不仅仅是谷歌的选择,更将成为AI时代大型科技企业的标准配置。

相关下载 +
全新上架 +
最新资讯 +
  • 日本人气最高的手游
    日本人气最高的手游 2026年日服手游竞争激烈,多款作品凭借精美画面、丰富玩法及深度剧情脱颖而出。涵盖角色扮演、策略经营、休闲益智等多种类型,均拥有高人气与良好口碑,成为日本玩家日常娱乐的重要选择。
  • 免费的真人剧情互动手游有哪些
    免费的真人剧情互动手游有哪些 免费的真人剧情互动手游有哪些?互动游戏是指那些可以通过感应系统感应玩家的动作,然后进行分析计算,从而执行相关的游戏命令的游戏,千人千面,你的每一个不同的选择将会让故事走向不一样的结局。真人类的互动游戏比传统互动游戏更吸引人的地方,在于它的真实性,打造出一个非常真实的游戏场景让玩家沉浸其中。小编今天就为大家带来真人互动恋爱养成游戏软件推荐,这些游戏提供多位风格独特的女主角供玩家选择,快来进入深度的互动体验吧。
  • 可玩性比较高的手游有哪些
    可玩性比较高的手游有哪些 可玩性比较高的手游有哪些?在游戏行业蓬勃发展的今天,手游类型层出不穷,满足不同玩家的各种需求,让玩家能在空闲之余在游戏世界里放松身心。它也以足够的便捷性和移动性让它积累了一大批潜在忠实用户。小编在本专题为大家整理出目前玩的人最多手游排行,这些游戏有丰富的玩法,出色的画质,有趣的情节,其中包含生存类、塔防类、策略类,快来下载看看哪个更适合你。
  • 免费追剧软件有哪些
    免费追剧软件有哪些 在2026年,寻找完全免费、无广告且安全的追剧软件是许多用户的共同需求。综合当下的各类软件推荐和排行榜,以下是一些被频繁提及、口碑较好的软件。
  • 刺激好玩的格斗游戏有什么
    刺激好玩的格斗游戏有什么 刺激好玩的格斗游戏有什么?喜欢玩格斗游戏的小伙伴们,一定不能错过这个热血格斗手游排行榜,这个榜单中的格斗游戏风格好切画面真实,给你最佳的游戏代入感。并且格斗招式很多,不同的角色擅长的招式也不同哟,大家可以给这些角色挑选合适的招式,在战斗时可以事半功倍。
  • 流行好玩的武侠游戏有哪些
    流行好玩的武侠游戏有哪些 流行好玩的武侠游戏有哪些?武侠小说大家一定都不陌生,很多人小时候应该都有看过武侠影视剧吧,不过这几年武侠相关的电视剧非常少,如果你想感受快意恩仇的江湖氛围,那就来看看小编整理的好玩的武侠手游排行榜吧,通过游戏我们也可以体验武侠生活,这里面的很多武侠游戏都是根据经典小说改编而来的哟。

今日更新 网站地图 排行榜

优装机下载站(https://www.uzhuangji.net/)版权所有:闽ICP备2026008968号-1

本站资源均收集整理于互联网,其著作权归原作者所有,如果有侵犯您权利的资源,请来信告知,我们将及时撤销相应资源。