Solution thermique informatique IA

Les applications d'IA accélèrent l'évolution des centres de données vers la haute densité. Face à la croissance explosive des données et de l'informatique provoquée par l'IA, et à la raréfaction des ressources des centres de données, en particulier dans les villes de premier rang, seule l'amélioration de la puissance de calcul, du stockage et des capacités de transmission par unité de surface de la salle informatique peut la valeur du centre de données soit maximisée. L'introduction de puces d'IA de haute informatique accélérera la tendance à l'évolution de la densité de puissance élevée des serveurs.

AI thermal cooling SINK

Alors que ChatGPT suscite un nouvel enthousiasme pour les applications d'intelligence artificielle, les centres de données nationaux et étrangers et les fabricants d'entreprises cloud ont commencé à promouvoir la construction d'infrastructures d'IA, et la proportion de livraisons de serveurs d'IA dans tous les serveurs augmente progressivement. Selon les données de TrendForce, le volume annuel d'expéditions de serveurs d'IA équipés de GPGPU représentait près de 1 % de tous les serveurs en 2022. En 2023, avec la prise en charge d'applications d'intelligence artificielle telles que ChatGPT, le volume d'expédition de serveurs d'IA devrait augmenter. de 8% sur un an. De 2022 à 2026, le TCAC du volume des expéditions devrait atteindre 10,8 %. Les GPU sont principalement utilisés pour les serveurs IA, principalement Nvidia H100, A100, A800 (principalement expédiés en Chine), ainsi que les séries AMD MI250 et MI250X. La proportion de NVIDIA et AMD est d'environ 8:2.

AI computing thermal sink

L'effet d'une vitesse de ventilateur supérieure à 4 000 tr/min sur la résistance thermique est limité. Selon CNKI, dans un système refroidi par air, la vitesse du ventilateur passe de 1 000 tr/min à 4 000 tr/min, et la convection domine la dissipation thermique des puces. Avec une augmentation du débit, le coefficient de transfert de chaleur par convection augmente considérablement. Le refroidissement par air peut améliorer efficacement les problèmes de dissipation thermique des puces. Lorsque la vitesse du ventilateur dépasse 4 000 tr/min, la diminution de la résistance au transfert de chaleur est relativement douce et une augmentation de la vitesse ne peut qu'améliorer le transfert de chaleur avec l'air, entraînant une diminution de l'effet de dissipation thermique. Le refroidissement liquide au niveau des puces est la tendance de développement future. Sous un espace serveur de 2U, 250 W est approximativement la limite pour le refroidissement par air et la dissipation thermique ; Au-dessus de 4U, le refroidissement par air peut atteindre 400-600 W ; Le TDP des puces IA dépasse généralement 400 W, utilisant principalement 4-8U. La dissipation thermique traditionnelle refroidie par air a atteint sa limite. Le contrôle de la température des copeaux est particulièrement important pour un fonctionnement stable et continu, avec une température maximale ne dépassant pas 85 degrés. Une température excessive peut endommager les copeaux. Dans une plage de 70-80 degrés, chaque augmentation de 10 degrés de la température d'un seul composant électronique réduit la fiabilité du système de 50 %. Par conséquent, dans le contexte d’une puissance accrue, le système de refroidissement sera mis à niveau vers un refroidissement liquide au niveau de la puce.

air cooling heatsink module

Comparé au refroidissement par air, le refroidissement liquide peut non seulement répondre aux exigences de dissipation thermique des armoires à haute densité de puissance, mais également atteindre un PUE inférieur et une puissance de sortie (GUE) plus élevée. Par rapport au refroidissement par air traditionnel, le PUE du refroidissement liquide par plaque froide est généralement de 1,1x, avec un GUE supérieur à 75 %, tandis que le PUE du refroidissement liquide par immersion peut être aussi bas que 1,0x, avec un GUE. de plus de 80 %. L'utilisation simultanée de la technologie de refroidissement liquide peut supprimer une partie, voire la totalité, des ventilateurs de l'équipement informatique (généralement, la consommation d'énergie des ventilateurs est également calculée dans la consommation d'énergie de l'équipement du serveur). Pour le refroidissement liquide immergé, le retrait du ventilateur du serveur peut réduire la consommation d'énergie du serveur d'environ 4 % -15 %.

immersion cooling liquid

La maturité actuelle de la technologie de refroidissement liquide à plaques froides est relativement élevée et elle est courante dans la voie de la technologie de refroidissement liquide. En supposant que la proportion actuelle soit de 80 %. À l’avenir, avec la maturité de la technologie de refroidissement par liquide par immersion, la proportion globale devrait augmenter progressivement. Sur la base de calculs complets, la formation et l'inférence de grands modèles d'IA apporteront un espace de marché du refroidissement liquide de 4 milliards de RMB. Avec l'augmentation des paramètres du modèle et la promotion de son utilisation, le marché du refroidissement liquide connaîtra un taux de croissance annuel composé de 60 % au cours des quatre prochaines années.

AI liquid cooling

Nous pensons que le grand modèle d'IA devrait conduire à l'amélioration de la demande en puissance de calcul, stimuler la construction de centres de calcul et de supercalcul intelligents à haute densité de puissance, accélérer l'introduction d'installations de soutien telles que les systèmes de refroidissement liquide sur le marché et, à l'avenir, , avec la construction de nouveaux centres de données et la transformation des centres de données existants, le taux de pénétration global devrait augmenter rapidement. À l'heure actuelle, l'industrie du refroidissement liquide en est encore à ses premiers stades de développement et elle est optimiste quant aux fabricants dotés d'une configuration de pointe en termes de technologie et de capacité de production.

Vous pourriez aussi aimer

Envoyez demande