3 月 21 日消息,據(jù)寒武紀(jì)官方消息,寒武紀(jì)今天正式發(fā)布新款訓(xùn)練加速卡 MLU370-X8,搭載雙芯片四芯粒思元 370,集成寒武紀(jì) MLU-Link 多芯互聯(lián)技術(shù),主要面向訓(xùn)練任務(wù)。
寒武紀(jì)表示,在業(yè)界應(yīng)用廣泛的 YOLOv3、Transformer 等訓(xùn)練任務(wù)中,8 卡計(jì)算系統(tǒng)的并行性能平均達(dá)到 350W RTX GPU 的 155%。
IT之家了解到,MLU370-X8 采用了 7nm 工藝,配備 48GB LPDDR5 內(nèi)存,F(xiàn)P32 單精度浮點(diǎn)性能達(dá)到 24 TFLOPS。
據(jù)介紹,MLU370-X8 智能加速卡提供 250W 最大訓(xùn)練功耗,可充分發(fā)揮 AI 訓(xùn)練加速中常見(jiàn)的 FP32、FP16 或 BF16 計(jì)算性能。寒武紀(jì)首次將雙芯片四芯粒思元 370 整合在 MLU370-X8 智能加速卡中,提供了兩倍于標(biāo)準(zhǔn)思元 370 加速卡的內(nèi)存、編解碼資源,同時(shí)搭載 MLU-Link™多芯互聯(lián)技術(shù)。
MLU370-X8 智能加速卡支持 MLU-Link™多芯互聯(lián)技術(shù),提供卡內(nèi)及卡間互聯(lián)功能。寒武紀(jì)為多卡系統(tǒng)專門設(shè)計(jì)了 MLU-Link 橋接卡,可實(shí)現(xiàn) 4 張加速卡為一組的 8 顆思元 370 芯片全互聯(lián),每張加速卡可獲得 200GB / s 的通訊吞吐性能,帶寬為 PCIe 4.0 的 3.1 倍,可高效執(zhí)行多芯多卡訓(xùn)練和分布式推理任務(wù)。
關(guān)鍵詞: