AI大模型空前火爆,應(yīng)用服務(wù)加速,正在走進人們的工作和生活。其中,大語言模型(LLM)以其在圖像、語音、自然語言處理等方面表現(xiàn)出的卓越能力,使其成為最重要的AI技術(shù)之一。 作為中國AI服務(wù)器市場的TOP3和中國領(lǐng)先的計算產(chǎn)品方案提供商,寶德堅持技術(shù)創(chuàng)新,基于英特爾AI軟硬件技術(shù)基礎(chǔ)等打造多樣性的AI算力和解決方案,為AI產(chǎn)業(yè)快速發(fā)展和AI大模型落地應(yīng)用做出積極的貢獻。
英特爾?至強?CPU Max系列,大語言模型工作負載的實力擔(dān)當(dāng)
一直以來,英特爾以廣泛的AI硬件和軟件組合助力大語言模型的普及,推動AI發(fā)展惠及各行各業(yè)。其中,第四代英特爾?至強?可擴展處理器以其原生AI加速能力和全面提升的整體性能,充分滿足大模型工作負載以及復(fù)雜AI計算場景的需求。
第四代英特爾?至強?可擴展處理器具有英特爾高級矩陣擴展(AMX)的AI加速功能,有全新的指令集與電路設(shè)計,可幫助諸如圖像識別、對象探測等任務(wù)中的張量處理獲得多倍效率提升,并可用于INT8、BF16等不同數(shù)據(jù)格式以加速深度學(xué)習(xí)訓(xùn)練和推理工作負載等多種類型的AI模型,性能高達上一代10倍。
英特爾?至強?CPU Max系列
在此基礎(chǔ)上,英特爾?至強?CPU Max系列更是大模型的算力擔(dān)當(dāng),它每顆CPU提供64GB的高帶寬內(nèi)存(HBM2E),兩顆共128GB,有效解決大語言模型工作負載經(jīng)常受到內(nèi)存帶寬限制的窘境。數(shù)據(jù)顯示,其針對建模、人工智能、深度學(xué)習(xí)、高性能計算 (HPC) 和數(shù)據(jù)分析等實際工作負載的性能提升了 4.8 倍。
基于英特爾?至強?CPU Max系列的寶德服務(wù)器,為大模型推理應(yīng)用提供澎湃算力
寶德自研雙路服務(wù)器PR2715E
寶德自研雙路服務(wù)器PR2715E,支持兩顆英特爾?至強?CPU Max系列,以比較基礎(chǔ)的32核心+64GB HBM緩存的Max 9462為例,該產(chǎn)品就可輕松支持60B參數(shù)下8路推理需求。它采用CPU+GPU異構(gòu)計算設(shè)計,有8個標(biāo)準(zhǔn)PCIe5.0插槽,可以支持8張單寬或3張雙寬包括英特爾?GPU Flex系列的GPU計算卡,強大的AI算力和安全技術(shù),能夠為大模型AI推理工作負載加速和護航。另外,該機型有32個DDR5內(nèi)存插槽,最大可支持8TB,支持400Gb/s高速網(wǎng)絡(luò),優(yōu)化低延遲應(yīng)用體驗;它最大支持12個2.5”( 3.5”)和4個后置2.5 ” SATA/SAS/NVMe熱插拔硬盤,或24個2.5”SATA/SAS/NVMe和2個后置2.5 ”SATA/SAS熱插拔硬盤,支持內(nèi)置1個M.2(NVMe/SATA),保障了整機性能的強勁可靠。此外,PR2715E支持液冷散熱方案,通過選用冷板液冷方案,可以有效減少AI大模型算力集群和數(shù)據(jù)中心的整體碳排放和顯著降低客戶TCO(總體擁有成本)。
寶德四子星服務(wù)器PR2745TE
尤其值得一提的是,寶德四子星服務(wù)器PR2745TE,在2U 機架中提供多達 4個雙路節(jié)點和高容量存儲,使得它1臺服務(wù)器就可以支持多達八顆英特爾?至強?CPU Max系列,從而完美支持60B參數(shù)下32路推理需求。而且,它在2U規(guī)格內(nèi)提供超常的吞吐量、存儲、網(wǎng)絡(luò)、I / O、內(nèi)存和處理能力,形成一個靈活的平臺,為要求苛刻的AI、高性能和橫向擴展等工作負載提供強勁動力。PR2745TE為簡化部署和維護而設(shè)計,并以最高質(zhì)量組裝,以確保最大容量的連續(xù)操作。客戶可以通過它提供的解決方案滿足最具挑戰(zhàn)性的IT 需求,并受益于特殊的總擁有成本(TCO)。 作為業(yè)界雙子星/多子星服務(wù)器的首創(chuàng),寶德四子星服務(wù)器久經(jīng)市場考驗,已經(jīng)幫助AI用戶、數(shù)據(jù)中心、 高性能計算和云計算環(huán)境的客戶獲得了來自數(shù)據(jù)中心資源的強大競爭優(yōu)勢,也將是大模型推理應(yīng)用堅實的算力基礎(chǔ)之一。
相關(guān)稿件