百万GPU集群?有点不顺应逻辑
(原标题:百万GPU集群?有点不顺应逻辑)
若是您但愿不错常常碰头,宽待标星储藏哦~
开首:内容编译自theregister,谢谢。
跟着 AI 激越参加第三年,来岁将有一些竟然遒劲的盘算情势开动实施。迄今为止暴露的最大情势之一是 xAI 策动将其 Colossus AI 超等盘算机从一经令东谈主印象真切的 100,000 个 GPU 膨大到 100 万个。
这么的数字似乎不顺应逻辑。即使你能为这款新的 Colossus提供满盈的 GPU ,撑握它所需的电力和冷却(更毋庸说老本)也将是巨大的。
按照每台 30,000 到 40,000 好意思元的价钱盘算,再增多 900,000 个 GPU 将使 xAI 耗损 270 到 360 亿好意思元。即使有激动的批量扣头,不管它们是否在几年里面署,它仍然未低廉。哦,这还莫得研讨到撑握通盘这些加快器的建筑、冷却和电力基础关节的成本。
说到电力,凭证 xAI 策动部署哪一代加快器,仅 GPU 节点就需要毛糙 1.2 到 1.5 千兆瓦的发电量。这比典型的核反映堆还要多,况兼比大型反映堆还要多。再说一遍,这只是用于盘算。
您的直观反映可能是将这些数字归功于一位乖癖的亿万财主,他的随心趣话被当地商会奉为真义,并被当处事实类似。关联词,当您研讨到竞争敌手的作念法时,这个新巨东谈主的范围看起来就没那么粗疏了。
东谈主工智能激越的末期
就在孟菲斯大商会公布 xAI 扩建策动细节的归并周,竞争敌手 Model Dev 和 Xitter 竞争敌手 Meta告示将培育我方的大型数据中心园区。该关节策动在路易斯安那乡镇奇兰教区培育,占地 400 万闲居英尺,耗资 100 亿好意思元。
Meta 尚未知晓该工场可能容纳几许台加快器,但首席推论官马克·扎克伯格一经首肯仅本年一年就部署 60 万台 GPU。从这个数字来看,分析师合计 Nvidia 在 2023 年全年出货的 H100 级 GPU 数目简直与此相配。
据咱们所知,该核电站很可能在异日几年分阶段培育,况兼将破钞多量电力。
动作参考,一个领有多个数据大厅的典型云数据中心园区的额定容量约为 50 兆瓦并不生分。鉴于好意思国的电力限度一经给数据中心运营商带来了问题,您可能会合计这对通盘这些千里醉于 AI 的超大范围企业、云提供商和模子构建者来说皆是一个问题——但事实上,他们只是在为我方的发电厂提供资金。
至于 Meta 的路易斯安那州园区,它已与 Entergy 互助建造了三台燃气轮机,总发电量卓著 2.2 千兆瓦。
咱们必须拭目以俟,望望通盘网点是否能完工。咱们只可思象,东谈主工智能泡沫芜杂可能会飞速坑害这些策动——假定它如实是一个泡沫。
不管若何,有了如斯遒劲的数字,建造一座核电站的思法短暂听起来并不那么粗疏。事实上,Meta 似乎特地有信心其电力需求将赓续增长,以至于它开动寻找未必在 2030 年代初为其提供 1 至 4 千兆瓦核能的供应商。
科技巨头们共同掀翻的东谈主工智能激越对通盘核工业产生了揭地掀天的变化,云盘算提供商纷纷出资复原退役反映堆,以至将他们的数据中心放在电表后头,比如 AWS 的新Cumulus 数据中心空洞体。
说到亚马逊,天然不单是是 Meta 和 xAI 在作念着大梦。这家电子商务巨头转型为云提供商,上周加大了其东谈主工智能狡计。在 re:Invent 大会上,这家超大范围企业展示了一系列东谈主工智能居品、系统和模子,其中包括一台与模子构建商 Anthropic 互助打造的东谈主工智能超等盘算机,使用了“数十万”台定制的 Trainium2 加快器,咱们只可思象,这些加快器本人也需要相配大的功率。
本年夏初,咱们对 Oracle 的“zettascale”超等盘算机进行了一些嘲讽,在 4 位精度和稀罕性的匡助下,其峰值输出将达到 2.4 zettaFLOPS。
固然在目下最常用的 FP/BF16 精度下,执行历练性能将接近 459 exaFLOPS,但它仍将使用多量 GPU(意象 131,072 个)。固然数目不足一百万,但与 CoreWeave 和其他公司部署的集群比较,这仍然相配遒劲。
咱们不错赓续——然而你显然了。
新的武备竞赛
似乎围绕生成式东谈主工智能的炒作不仅编削了咱们对膨大盘算的见解。
从很多方面来看,咱们在东谈主工智能边界看到的老本治愈皆让东谈主思起了天际竞赛,只是中国演出的是红色胁迫的扮装,而不是俄罗斯。
将东谈主类送入轨谈(更毋庸说送入月球)需要克服无数贫苦,这迫使科学家和工程师们克服挑战,鼓励时代卓著,推动通盘宇宙前进。
固然这其中细目有民族主张的成分,但这并非是一个国度与另一个国度之间的竞争。推动这些投资的是宇宙上一些最大、最遒劲的公司。
看来,在这场新的东谈主工智能武备竞赛中,咱们可能会看到类似的情况,因为电力、冷却和经济拘谨推动了对核能或可握续盘算等边界的投资。这不是因为这是正确的作念法,而是因为这关系到比赛的赢输——以及收获。
https://www.theregister.com/2024/12/19/scale_ai_defies_logic/
半导体杰作公众号推选
专注半导体边界更多原创内容
关心环球半导体产业动向与趋势
*免责声明:本文由作家原创。著作内容系作家个东谈主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或撑握,若是有任何异议,宽待关系半导体行业不雅察。
今天是《半导体行业不雅察》为您共享的第3984期内容,宽待关心。
『半导体第一垂直媒体』
及时 专科 原创 深度
公众号ID:icbank
可爱咱们的内容就点“在看”共享给小伙伴哦