日韩av无码中文字幕,国产午夜亚洲精品国产成人小说,成人影院午夜男女爽爽爽,欧美 亚洲 中文 国产 综合

首頁 熱點(diǎn) 要聞 國內(nèi) 產(chǎn)業(yè) 財(cái)經(jīng) 滾動(dòng) 理財(cái) 股票

大模型改變算力,新華三加碼算力集群能力 天天報(bào)道

2023-06-21 18:54:01 來源 : 鈦媒體

算力與應(yīng)用的發(fā)展,是一個(gè)不斷上升、循環(huán)往復(fù)的過程,每當(dāng)算力提升到一個(gè)新高度,總是會(huì)催生新的應(yīng)用,新應(yīng)用出現(xiàn)又需要更高的算力來支持。大模型就是算力發(fā)展歷史上的一個(gè)關(guān)鍵節(jié)點(diǎn)。


【資料圖】

“大家可以把‘算力自由’想象成第二次工業(yè)革命,電氣化時(shí)代,愛迪生發(fā)明燈泡是一個(gè)標(biāo)志性時(shí)刻,但最關(guān)鍵的是誰能夠把產(chǎn)品做出來,普惠大眾?!毙氯A三集團(tuán)副總裁、計(jì)算存儲(chǔ)產(chǎn)品線總裁徐潤安表示。

大模型對(duì)算力的改變才剛剛開始,大模型將來會(huì)消耗多少算力,或者說產(chǎn)生大模型算力的方法會(huì)有多少種,現(xiàn)在都是未知數(shù)。

“我相信在不遠(yuǎn)的將來,整個(gè)算力市場(chǎng)都會(huì)帶來新一輪的革命,不論是硬件還是軟件,所有的目的都是為了源源不斷地提供算力給AI,當(dāng)然我也相信,AI也會(huì)創(chuàng)造出更多新的方法,提高算力使用的效率”,徐潤安補(bǔ)充表示。

而目前,大模型對(duì)算力的改變已經(jīng)有跡可循。

算力走向全局化

傳統(tǒng)計(jì)算以集中式架構(gòu)為主,一定程度上存在復(fù)雜、低效、僵化的問題,但隨著分布式架構(gòu)重塑算力形態(tài),需要在擴(kuò)展性、管理性、安全性等方面實(shí)現(xiàn)全面升級(jí),并將向著高效、低碳、智能的方向加速發(fā)展。

新華三集團(tuán)計(jì)算存儲(chǔ)產(chǎn)品線副總裁劉宏程表示,“大模型到來之后,今天談到的算力,更多是計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)一體化解決方案的融合。我們從客戶那了解到,只賣GPU不夠,建立一個(gè)全方位的解決方案,需要把服務(wù)器、存儲(chǔ)和網(wǎng)絡(luò)綜合形成一個(gè)整體解決方案,才能幫助用戶建立大模型環(huán)境,最終落實(shí)到行業(yè)應(yīng)用中?!?/p>

上游芯片廠商每一次的產(chǎn)品更新,都意味著下游服務(wù)器廠商需要重新做一次研發(fā),例如英偉達(dá)GPU從Ampere架構(gòu)更新到Hopper架構(gòu),新華三的服務(wù)器R5500 G5也隨之更新到R5500 G6。

其中,除了GPU的變化,CPU也更新到下一代, PCle從過去的Gen4到Gen5,網(wǎng)絡(luò)從過去的100G和200G為主,升級(jí)為200G和400G為主。此外,新的網(wǎng)絡(luò)互聯(lián)、xPU、DPU等技術(shù)也變得越來越成熟,這就要求服務(wù)器廠商有相對(duì)完善的儲(chǔ)備。

服務(wù)器本身就是系統(tǒng)級(jí)工程,大模型的改變是將服務(wù)器集群視作整體,需要在更大范圍做系統(tǒng)級(jí)別優(yōu)化。

劉宏程介紹,“從我們現(xiàn)在看到的用戶實(shí)踐,客戶要求無損網(wǎng)絡(luò),RDMA也好,RoCE也好,不能丟一個(gè)數(shù)據(jù)包。丟一個(gè)數(shù)據(jù)包,有可能前面幾十個(gè)小時(shí)訓(xùn)練的數(shù)據(jù)要重算,用戶算力的利用率會(huì)降到非常低的水平,我們見過客戶因?yàn)檎{(diào)度不靈活,算力甚至只用了5%、10%,服務(wù)器就在那空轉(zhuǎn)?!?/p>

“每跨一臺(tái)服務(wù)器,性能就會(huì)有一定的削減,這個(gè)削減來源于服務(wù)器之間互聯(lián)和數(shù)據(jù)之間的調(diào)度,比如存儲(chǔ)數(shù)據(jù)怎么獲得,兩臺(tái)不同的服務(wù)器之間網(wǎng)絡(luò)帶寬和延遲是多少,這些都是整個(gè)AIGC解決方案里面需要綜合考慮的部分?!彼f。

此外,高能耗也是大模型算力的一個(gè)客觀限制,很多客戶一個(gè)機(jī)柜里只放一臺(tái)GPU服務(wù)器,甚至兩個(gè)機(jī)柜放一臺(tái),就是因?yàn)槟芎膯栴}。根據(jù)ODCC的數(shù)據(jù)顯示,2020年我國數(shù)據(jù)中心能耗總量為939億千瓦時(shí),碳排放量為6464萬噸。預(yù)計(jì)到2030 年,能耗總量將達(dá)到3800億千瓦時(shí)左右,碳排放增長率將超過 300%。如何做到綠色低碳,也是大模型算力的一個(gè)瓶頸。

“一體·兩中樞”,新華三補(bǔ)短板

以云計(jì)算為代表的廠商,在大模型算力集群方面刷足了存在感,這就要求服務(wù)器廠商補(bǔ)充相應(yīng)的能力,近年來已有跡象,例如云服務(wù)商和服務(wù)器廠商在私有云領(lǐng)域直接競(jìng)爭(zhēng),大模型則將這一競(jìng)爭(zhēng)推到更深層次,新華三于去年底推出的“一體·兩中樞”智慧計(jì)算體系,增加了競(jìng)爭(zhēng)籌碼。

“一體”是指新華三以CPU、GPU和xPU為核心,構(gòu)造出的覆蓋通用計(jì)算、異構(gòu)計(jì)算等全場(chǎng)景的多元計(jì)算體系,并在近年通過液冷等低碳技術(shù)的融合,構(gòu)建起高效、低碳數(shù)據(jù)中心的算力基石;

“兩中樞”分別對(duì)應(yīng)智能算力中樞(傲飛)和智能管理中樞,新華三智能算力中樞(傲飛)能實(shí)現(xiàn)傳統(tǒng)科學(xué)計(jì)算與AI計(jì)算深度融合,同步實(shí)現(xiàn)科學(xué)計(jì)算批量作業(yè)和AI容器作業(yè)的調(diào)度編排,滿足教育、科學(xué)、能源、制造等高性能計(jì)算場(chǎng)景需求。

智能管理中樞提供部署、調(diào)優(yōu)、節(jié)能、診斷、退役都能能力,為數(shù)據(jù)中心服務(wù)器提供全生命周期智能管理,能幫助企業(yè)提高運(yùn)維效率,降低運(yùn)維成本,客戶可根據(jù)具體的業(yè)務(wù)需求對(duì)服務(wù)器進(jìn)行靈活的配置部署,從而打造自己專屬的運(yùn)維環(huán)境。

可以理解“一體”是新華三的算力基礎(chǔ),而“兩中樞”拓展了智算算力的集群能力,對(duì)應(yīng)的是服務(wù)器集群的管理。

譬如ChatGPT參數(shù)達(dá)到了1750億,每個(gè)參數(shù)如果只算2個(gè)字節(jié),意味著需要8塊最高端的GPU卡,才能容下所有的參數(shù),實(shí)現(xiàn)靈活的應(yīng)用,進(jìn)一步驅(qū)動(dòng)算力從通用轉(zhuǎn)向GPU、NPU或者xPU等綜合算力,高并發(fā)的情況需要更多差異化算力單元來滿足。

“我們看到調(diào)度比較有效率的就是64卡和128卡,再往高其實(shí)已經(jīng)開始有衰減,需要跨另外一個(gè)網(wǎng)絡(luò)做調(diào)度?!眲⒑瓿陶f。

據(jù)了解,新華三大部分客戶所使用的GPU集群數(shù)量在64、128和256卡級(jí)別,衰減相對(duì)比較弱,現(xiàn)有的網(wǎng)絡(luò)限制比較接近128卡的算力限制。舉例來看,現(xiàn)在網(wǎng)絡(luò)架構(gòu)可能8000個(gè)端口,一般一個(gè)計(jì)算模塊對(duì)一個(gè)網(wǎng)絡(luò)端口進(jìn)行調(diào)度,8000個(gè)端口對(duì)應(yīng)128個(gè)GPU,超過這個(gè)數(shù)量,就跨入另外一個(gè)網(wǎng)絡(luò),需要兩臺(tái)交換機(jī)。

“當(dāng)前GPU市場(chǎng)較為火熱,但是NPU和xPU的技術(shù)在中間也起到了非常關(guān)鍵的作用”,劉宏程說,“一體”就是多元算力,新華三之前提出的觀點(diǎn)得到了驗(yàn)證,讓用戶根據(jù)場(chǎng)景來選擇不同的算力單元,滿足不同的計(jì)算需求。

(本文首發(fā)APP 作者|張帥,歡迎添加作者微信mr3right交流)

關(guān)鍵詞:
相關(guān)文章

最近更新
精彩推送
高壓鍋燉牛肉? 2023-06-21 19:01:47