GTC 2024硬件一览:史上最强AI芯片GB200揭晓高达80亿晶体管

 常见问题     |      2024-03-19 16:03:39    |      小编

  原题目:GTC 2024硬件一览:史上最强AI芯片GB200宣布!高达2080亿晶体管!

  当行家还正在睡梦中时,大洋彼岸有一场“科技春晚”寂静召开。没错,又到了一年一度的GTC大会功夫。本年的GTC大会分歧以往,毕竟复原了线号。先给不睬会GTC的玩家先容一下,GTC是闭于AI的NVIDIA开荒者大会,聚会中你能够理会何如欺骗AI、加快算计以及数据科学去塑造乃至是转移寰宇。

  本年的GTC峰会重心一律盘绕AI张开硬件,2个幼时的时代,老黄又一次带来了AI的改良功夫。当然除了老黄的开张演讲表,后面另有900多场促进人心的聚会正在等着你。同时此次GTC大会还吸引了凌驾200家展商,集聚了数千名分歧行业界限的从业职员一同参预。充分多彩的技能分享、越见出多的改进技能,称它是AI的嘉会都不为过。思必你也好奇老黄毕竟正在GTC上带来了什么惊喜吧,别恐慌,本篇带你一见GTC峰会上的那些硬件产物。

  峰会伊始,咱们熟谙的皮衣刀客准时退场。一上来就直奔此日的重心——AI,并表现“加快式算计机的临盆力仍旧来到了一个转机点,天生式AI正正在加快生长,而咱们须要以一种全新的方法举办算计,才或许进一步提升算计机临盆力。”

  而且还知心的涌现了其本身亲手画出的闭于算计机临盆力的演变流程,最终一项恰是此日的重心!

  没错,老黄正在GTC公布推出新一代GPU Blackwell。这里先先容一下Blackwell架构,此前NVIDIA推出的显卡普通是两种架构,此中游戏显卡比如咱们熟谙的RTX 40系则是Ada Lovelace架构,而面向AI、大数据等利用的专业级显卡则采用Hopper 架构。

  而老黄正在大会上则表现“Blackwell不是一个芯片,它是一个平台的名字。”旨趣是Blackwell架构将同时用于以上两品种型的产物。借帮这一架构,NVIDIA将推出涵盖多个利用界限的显卡,即RTX 50系显卡也会是这个架构硬件。而且从老黄手上的芯片能够看出,新的Blackwell GPU的体积彰彰比上代Hopper GPU要更大极少。

  至于这个架构名字的由来,则要追溯到美国科学院首位黑人院士、加州大学伯克利分校首位黑人毕生教化戴维·布莱克维尔(David Blackwell),它是出名的数学家、统计学家,但是很怅然的是这位教化正在2010年因病逝世。

  言反正传,让咱们一连体贴此次Blackwell GPU。“咱们须要更大的GPU,借使不行更大,就把更多GPU组合正在一齐,造成更大的虚拟GPU。”老黄正在GTC上也确实这么干了。Blackwell架构的首个GPU为B200,因为目前4nm造程工艺仍旧切近极限,是以NVIDIA也玩起了“拼图”,B200采用台积电的 4 纳米(4NP)工艺蚀刻而成,由两个芯片通过NVLink 5.0组合正在一齐,以10TB每秒的满血带宽互联硬件,总的晶体管数目更是抵达了恐慌的2080 亿。

  第五代NVLink互连则是将多个Blackwell GPU组合起来的苛重器材。它与古板的PCIe相易机分歧,NVLink带宽有限,能够正在效劳器内的GPU之间完成高速直接互连。目前第五代NVLink可每个GPU 供给了1.8TB/s双向模糊量,确保多达576个GPU之间的无缝高速通讯。

  这个RAS牢靠性引擎则是基于AI完成,Blackwell 透过专用的牢靠性、可用性和可保卫性 (RAS) 引擎,可填补灵敏规复材干,趁早辨认出恐怕产生的潜正在妨碍,尽恐怕缩短停机时代。

  Secure AI担当供给秘要运算功效,同时Blackwell也是业界第一款维持EE-I/O的GPU,它能够正在不影响功能的条件下,保卫你的数据太平,这关于金融、医疗以及AI方面有极大感化。

  最终一项改进技能则是闭于解压缩层面,原料剖判和原料库事情流程此前更多是仰赖CPU 举办运算。借使放到GPU中举办则可大幅晋升端对端剖判的服从,加快造造价钱,同时低重本钱。

  Blackwell装备了专用的解压缩引擎,运用进程中能够配合内置的Grace CPU完成每秒900 GB的双向频宽,而且还能分身最新的压缩式子 (如 LZ4、Snappy和Deflate等)。

  而两个B200 GPU与Grace CPU贯串就成为此日“炎热”的GB200超等芯片。这款超等芯片的功能尤其惊人,你认为H100仍旧很速了?不!GB200更速,过去,正在90天内演练一个1.8万亿参数的MoE架构GPT模子,须要8000个Hopper架构GPU。现正在,你只须2000个Blackwell GPU就能够杀青。

  官方称,正在准绳的1750亿参数GPT-3基准测试中,GB200的功能是H100的7倍,供给的演练算力是H100的4倍。

  不止是功能更速更强,Blackwell GPU还相当节能。照旧同样的操作,90天内演练一个1.8万亿参数的MoE架构GPT模子,8000个Hopper GPU要挥霍15兆瓦功耗,而今的Blackwell GPU仅需1/4的能耗就能完成硬件硬件。

  借使你须要更强劲的GPU,NVIDIA也面向有大型需求的企业供给造品效劳,供给无缺的效劳器。比如:GB200 NVL72,它将36个CPU和72个GPU插入一个液冷机架中,总共可完成720 petaflops的AI演练功能或1,440 petaflops(1.4 exaflops)的推理。

  与一致数方针72个H100比拟,GB200 NVL72的功能绝对是逆天的存正在,大模子推理功能能够晋升30倍,而且本钱和能耗惟有前者的1/25。

  以上即是本次GTC 2024的硬件闭系报道,恐怕有玩家会说,怎样没有游戏显卡?本来遵照过往通例,NVIDIA并没有正在GTC上推出消费级显卡的风气。但是本次NVIDIA正在GTC 2024上推出的B100显卡所运用的架构是Blackwell,上面咱们也讲过了,这是一个横跨数据核心与消费级产物的架构,这也就意味着咱们熟谙的GeForce显卡该当也是统一架构的产物,不出不测的话,下半年咱们就希望看到心心念念的RTX 50系显卡了!返回搜狐,查看更多GTC 2024硬件一览:史上最强AI芯片GB200揭晓高达2080亿晶体管