Nvidia čelí vážným problémům s přehříváním u nové generace Blackwell GPU, určených pro datová centra a HPC aplikace. Tyto procesory, které jsou klíčové pro AI a strojové učení, se přehřívají při instalaci ve vysokokapacitních serverových stojanech (72 GPU na stojan).
Spotřeba energie dosahuje až 120 kW na rack, což vede k omezenému výkonu a možnému poškození komponent. Nvidia musela několikrát přepracovat design stojanů, což způsobilo zpoždění dodávek.
Navíc dřívější výrobní problémy s technologií CoWoS-L přinutily Nvidii ke změnám ve struktuře GPU, což posunulo výrobu do října 2024. Předpokládá se, že první dodávky budou dostupné až od ledna 2025. Tyto zpoždění ovlivňují plány velkých zákazníků, jako jsou Google, Meta a Microsoft, kteří potřebují tyto GPU pro trénink pokročilých AI modelů.
Doporučení COMPOS News:
Pro IT manažery a specialisty je toto důležitá připomínka, že plánování modernizace IT infrastruktury musí zahrnovat časovou rezervu a strategického partnera, který pomůže překonat podobné technické výzvy. COMPOS DISTRIBUTION díky svému partnerství se Supermicro nabízí řešení s optimalizovaným chlazením, které minimalizuje rizika spojená s přehříváním a zajišťuje hladkou implementaci moderních GPU technologií.
Kontaktujte nás pro konzultaci a návrh serverového řešení šitého na míru vašim potřebám. 📧 obchod@compos.cz | 📞 +420 725 307 607.
Zdroj: Tom’s Hardware
https://www.tomshardware.com/pc-components/gpus/nvidias-data-center-blackwell-gpus-reportedly-overheat-require-rack-redesigns-and-cause-delays-for-customers