• 凯时KB88·(中国区)官方网站

    
    中文-Chinese 英語-English
    應用案例

    經過20多年的發展,凯时KB88持續而深刻地把握市場需求,積累了海量的客戶資源和豐富的服務經驗

    某大學科研平台解決方案
    案例背景

    某大學某學院擬建設科研人工智能共享共建平台,面向全院提供計算資源服務,軟件基於K8S架構,可實現計算資源集中管理、靈活分配,支持定製開發,支持多用戶使用等。此次建設需把學院前期購置的一台GPU服務器,一台40T容量的服務器納管進來,形成平台系統,達到:

    1) 統一平台管理,由基礎設施層作為整個平台的支撐,通過雲平台對底層資源進行靈活的調度管理,通過系統功能層為用戶端和管理端降低 AI 技術門檻,釋放AI 技術潛力;
    2) 解決「信息孤島」,實現信息共享,提高信息安全水平,提升科研體驗,提高工作效率;
    3) 通過新平台建設降低成本、提升效率、節能減排,滿足學院科研資源充分利用的要求。

    案例分析

    凯时KB88HPC解決方案拓撲圖

    解決方案

    該方案平台使用凯时KB88PLStack實現,由管理系統和業務系統組成,將兩者從底層IT資源中分離開來,以提高管理系統的可移植性和業務系統的後期擴展性。集群拓撲設計從浮點計算能力強、GPU卡管理便捷、擴展豐富三個原則出發,將計算資源和管理資源進行分離,同時管理網絡與計算網絡分開,避免管理對計算網絡資源的擠占,集群網絡分為:計算網絡、管理網絡兩個平面:


    計算網絡:單口100Gb IB匯聚鏈路,用於連接所有GPU計算節點,同時提供塊設備、對象存儲等服務;

    管理網絡:雙口千兆匯聚鏈路,用於管理人工智能平台中的所有節點,為管理員提供 Web 控制台;

    客戶收益

    高帶寬、低延遲

    (1)計算網絡採用了100Gb/s的高帶寬IB網絡,大大提高了各節點之間的通信能力,降低了延遲,並且通過IB交換機實現所有GPU計算節點的全互聯;


    高擴展性

    (2)能夠根據用戶需求靈活對現有的計算資源和存儲空間進行擴展,彈性靈活;


    高性價比

    (3)新平台建設將閒置資源進行統一納管並二次利用,為客戶降低成本、提高資源利用率,滿足學院科研資源充分利用的要求;