[行業(yè)動態(tài)]首顆SSD主控鎮(zhèn)岳510,構建數(shù)據(jù)中心巔峰存力!
日前,在2023年云棲大會上,平頭哥半導體發(fā)布首顆SSD主控芯片鎮(zhèn)岳510。自布局倚天710 CPU、羽陣RFID射頻標簽等芯片之后,平頭哥這次將產(chǎn)品線拓展到存儲領域。
鎮(zhèn)岳510 SSD主控芯片支持先進的PCIe 5.0接口,支持DDR5.0技術,內置玄鐵910 RISC-V多核CPU,采用平頭哥自研芯片架構,同時針對云計算場景專門優(yōu)化存儲設備,能夠發(fā)揮更佳的性能。
為什么平頭哥會選在這個時間點發(fā)布企業(yè)級SSD主控芯片?平頭哥產(chǎn)品總監(jiān)周冠鋒表示,SSD每隔三四年會進行一次產(chǎn)品迭代。2023年是SSD從PCle4.0到PCle5.0的重點演進節(jié)點。因此平頭哥提前規(guī)劃這顆PCle5.0接口協(xié)議的芯片來順應市場趨勢,同時滿足平頭哥在數(shù)據(jù)中心的業(yè)務開展需求。
至此,面向數(shù)據(jù)中心、云計算領域,平頭哥實現(xiàn)了存力這一不可或缺環(huán)節(jié)的高階部署。
軟硬件協(xié)同創(chuàng)新,核心指標業(yè)界領先
■十大网投正规信誉官网■十大网投靠谱平台 知道數(shù)據(jù)中心的存力就是存儲設備的能力,一般來說包括性能、能效、可靠性、時延等主要指標。以SSD來看,主要體現(xiàn)在,給予的讀寫帶寬和IOPS(每秒的讀寫次數(shù)),SSD每消耗一瓦功耗可以給予的性能,SSD糾錯的能力強度也就是UBER(即每讀取多少筆數(shù)據(jù)會有一筆數(shù)據(jù)可能糾錯失?。?,以及SSD從收到命令到返回響應的時延。從這幾個維度來看,平頭哥鎮(zhèn)岳510已達到業(yè)界領先水平。
從性能上來說,平頭哥鎮(zhèn)岳510 SSD主控芯片可以支持3400K IOPS的能力,在業(yè)界屬于第一梯隊。一枚鎮(zhèn)岳510的性能相當于1萬塊高性能HDD的性能總和。在能效比方面,鎮(zhèn)岳510 每瓦功耗可給予420K IOPS,也是業(yè)界領先水平。以一個部署10萬塊SSD的數(shù)據(jù)中心為例,相比現(xiàn)在主流的PCIe 4.0 SSD,鎮(zhèn)岳510在相同的性能下僅主控芯片即每年節(jié)省260萬度電,按照一度電排放0.785千克二氧化碳計算,每年可減少二氧化碳排放2千噸。
同時,鎮(zhèn)岳510內置創(chuàng)新的IO自動化處理機制,前端IO解析與處理,由專用硬件模塊自動完成,實現(xiàn)了業(yè)界領先的超低的時延(4μs),可以帶給應用極佳的體驗,比業(yè)界SSD降低30%以上。不僅如此,鎮(zhèn)岳510芯片內實現(xiàn)了IO/SYS/GC的全鏈路隔離,極大的降低這些任務之間的相互干擾,給予了既低又穩(wěn)定的時延表現(xiàn)。
可靠性方面,鎮(zhèn)岳510內置了平頭哥自研的高性能LDPC糾錯算法,編碼效率逼近香農(nóng)極限,同時ErrorFlow相比業(yè)內SSD更優(yōu)一個數(shù)量級;同時借助平頭哥自研閃存電壓預測算法,可以在各種閃存的不同工況、壽命、溫度等條件下,準確預測閃存電壓漂移,進一步降低LDPC解碼器的輸入誤碼率。其實現(xiàn)了低至10^-18的UBER,相當于每讀取百億億筆數(shù)據(jù),才可能有一筆數(shù)據(jù)糾錯失敗。這樣的指標同樣處于業(yè)界領先水平。
自研SSD設計架構
現(xiàn)在在業(yè)界SSD主控芯片的架構設計主要有兩種方案,一種類似于純SoC,由軟件主打。也就是從主機的命令接收到解析到拆分,到各種表象的管理,再到芯片后端應用的組裝和下發(fā)等等都是由CPU來完成。
另一種方案是軟硬件結合,可以大幅卸載硬件負載。平頭哥SSD團隊經(jīng)過長時間的驗證,結合計算性能以及能耗的權衡,最終選定了軟硬件結合的方案。
周冠鋒分析,在這顆SSD主控芯片里使用了比較獨特的硬件加速模塊,進行了卸載加速,實現(xiàn)較好的性能和低功耗。同時還采用了自研的數(shù)據(jù)糾錯算法,可以把數(shù)據(jù)恢復的可靠性再優(yōu)化一個數(shù)量級。此外, ■十大网投正规信誉官网■十大网投靠谱平台 還跟阿里云聯(lián)合定制一些特性,使得這顆芯片在云上應用時整個存儲系統(tǒng)的性能、能效和服務質量更好。
區(qū)別于消費級芯片,企業(yè)級SSD主控芯片要求陸續(xù)在數(shù)年工作,7*24小時全天在線,企業(yè)級SSD的工作環(huán)境并不需要承擔大量的應用訪問,但對性能帶寬IOPS有著更高要求。除了讀寫速度外,企業(yè)級SSD主控還要支持端到端的數(shù)據(jù)保護,支持虛擬化以及一些新的協(xié)議比如ZNS。現(xiàn)在平頭哥已經(jīng)掌握了SSD主控芯片設計的全部技術。
與數(shù)據(jù)中心、云計算業(yè)務高度耦合
為了滿足云上業(yè)務的迅猛開展,以CPU為代表的通用算力,以GPU、NPU為代表的的AI算力,呈指數(shù)級增加;網(wǎng)絡也從25GE、100GE、200GE快速演進,并進入400GE、800GE時代。而以SSD為代表的存力,需與算力、網(wǎng)力相匹配開展。但數(shù)據(jù)中心SSD存儲在高讀寫吞吐速率、復雜負載下的穩(wěn)定時延、更優(yōu)的TCO、更高的存儲密度等方面都存在著挑戰(zhàn)。例如,云上為了提高并發(fā)能力,業(yè)務請求通常會被拆分為多筆子請求分散到眾多SSD并發(fā)執(zhí)行。任何一塊SSD的時延發(fā)生抖動,都會造成整個業(yè)務請求的延遲。
平頭哥對阿里云業(yè)務有著更深刻的理解,SSD主控芯片的設計與云應用場景高度耦合,從而給予更好的性能體驗。對于此,周冠鋒表示鎮(zhèn)岳510主要做了幾方面的適配優(yōu)化。
第一時間是消除SSD接口稅。在傳統(tǒng)的系統(tǒng)方案中,SSD與存儲系統(tǒng)分離設計,也就是存儲語議、閃存數(shù)據(jù)排布和啟停SSD后臺任務等動作相對割裂,給整個存儲系統(tǒng)的性能與壽命帶來了額外消耗。
為了消減“SSD接口稅”,2021年5月,ZNS協(xié)議被收入NVMe規(guī)范2.0版本中,并得到了SPDK、Linux以及各設備商的支持。ZNS協(xié)議是順利獲得將盤內FTL層(即閃存轉換層)上移至存儲系統(tǒng),達到了存儲系統(tǒng)與閃存特性的匹配。
鎮(zhèn)岳510完美實現(xiàn)了ZNS協(xié)議,順利獲得靈活的硬件表項加速保持了高IO性能,Zone分區(qū)狀態(tài)交由玄鐵910維護,保留了對新協(xié)議的靈活性。同時,鎮(zhèn)岳510定制了Last Sector(最后一個扇區(qū)) 隨機寫功能,實現(xiàn)了小報文的多次反復下盤,簡化了ZNS的應用難度。
總之,鎮(zhèn)岳510順利獲得存儲軟件與NAND特性完美契合,達到數(shù)據(jù)排布的最優(yōu)化,后臺操作的最小化,從而消除SSD接口稅。
其次是全鏈路QoS優(yōu)化(QoS即服務質量,代表SSD性能穩(wěn)定性的指標)。NVMe規(guī)范中制定了以隊列為粒度的標準SQ(即用戶隊列)調度機制,但其靈活性較差,對于業(yè)務種類復雜、追求靈活可配的云存儲系統(tǒng)來說,它并不是最佳選擇。
鎮(zhèn)岳510在支持NVMe標準的SQ調度機制的同時,額外定制了基于IO粒度的優(yōu)先級調度機制,允許系統(tǒng)按IO打標,優(yōu)先級種類多達8級,結合云存儲系統(tǒng),能夠更好的保障延遲敏感型業(yè)務的服務質量。
再者是智能卸載。鎮(zhèn)岳510以IO為粒度,遵循上層存儲語義進行校驗,補齊了整個存儲系統(tǒng)的數(shù)據(jù)鏈路校驗的最后一環(huán)。不僅如此,鎮(zhèn)岳510還支持以存儲語義對內部數(shù)據(jù)進行后臺巡檢,而無需再讀出至服務器,節(jié)省了寶貴的PCIe帶寬、服務器內存帶寬與CPU算力。
為AI計算、數(shù)據(jù)爆炸時代而生
平頭哥鎮(zhèn)岳510 作為一款高端企業(yè)級SSD主控芯片主要應用于比如AI計算、大數(shù)據(jù)分析、在線交易以及高性能數(shù)據(jù)庫等場景。據(jù)悉,這顆芯片很快將進入量產(chǎn)階段,并第一時間在阿里云上線使用。同時,它不僅適用于阿里云,也同樣適用于外部的不同云環(huán)境。
今年以ChatGPT為代表的AI大模型對數(shù)據(jù)量、對SSD設備的讀取帶寬等提出更高要求,也帶來更多存儲機遇。周冠鋒提到,存儲方案設計需考慮數(shù)據(jù)源和數(shù)據(jù)落地情況,例如AI推理注重存儲的帶寬、時延。AI訓練注重IOPS。總之底層的SSD主控芯片在設計時要充分考慮上層應用的IO模型。
每一年全球數(shù)據(jù)量呈指數(shù)級增長,數(shù)據(jù)爆炸的趨勢下存儲設備擔負更多數(shù)據(jù)存儲和實時分析的功能,這也為數(shù)據(jù)中心存儲帶來巨大的開展?jié)摿Α?/p>
小結
從PCle3.0開始,幾乎每演進一代都大約花費四年的時間,如今數(shù)據(jù)中心來到PCle5.0時代,平頭哥與時俱進推出PCle5.0 SSD主控芯片,提前卡位下一個黃金開展期。周冠鋒預計PCle5.0會是一個長周期的協(xié)議。而平頭哥的SSD主控芯片產(chǎn)品線將延續(xù)高性能企業(yè)級路線,不斷滿足數(shù)據(jù)中心、云計算的需求。