了解金山云最新資訊
2025-07-31 15:17:00
7月22日,由中國(guó)通信標(biāo)準(zhǔn)化協(xié)會(huì)主辦、中國(guó)信息通信研究院承辦的2025可信云大會(huì)在京舉辦。會(huì)上,金山云成為首批通過(guò)可信AI云數(shù)據(jù)安全能力檢測(cè)的企業(yè);同時(shí),公司斬獲兩項(xiàng)技術(shù)典型實(shí)踐獎(jiǎng)。
作為國(guó)內(nèi)云計(jì)算領(lǐng)域信任體系的權(quán)威評(píng)估,可信云自2013年至今已舉辦多屆云計(jì)算行業(yè)技術(shù)盛宴,是我國(guó)云計(jì)算產(chǎn)業(yè)發(fā)展的風(fēng)向標(biāo)。其系列標(biāo)準(zhǔn)及評(píng)估結(jié)果已成為政府支撐、行業(yè)規(guī)范、用戶(hù)選型的重要參考。
行業(yè)首批
金山云通過(guò)可信AI云數(shù)據(jù)安全能力檢測(cè)
隨著AI等前沿技術(shù)的快速發(fā)展,云與AI融合不斷加深,云上AI服務(wù)的用戶(hù)數(shù)據(jù)面臨超范圍收集、未經(jīng)授權(quán)使用、外部攻擊竊取等安全風(fēng)險(xiǎn),解決隱私安全保護(hù)、數(shù)據(jù)價(jià)值成為當(dāng)前企業(yè)面臨的難題。
憑借十余年技術(shù)積累與行業(yè)實(shí)踐經(jīng)驗(yàn),金山云圍繞數(shù)據(jù)處理全生命周期合規(guī)性、模型服務(wù)安全防護(hù)、安全機(jī)制長(zhǎng)效保障三大維度構(gòu)建核心能力,以便為用戶(hù)提供安全可靠的AI云服務(wù)。通過(guò)可信AI云數(shù)據(jù)安全能力評(píng)測(cè),既充分印證了金山云的綜合實(shí)力,也彰顯了其主動(dòng)對(duì)標(biāo)行業(yè)安全標(biāo)準(zhǔn)、積極踐行合規(guī)責(zé)任的擔(dān)當(dāng)。
落地價(jià)值凸顯
金山云斬獲兩項(xiàng)技術(shù)典型實(shí)踐獎(jiǎng)
本次,金山云在智算云與智算集群服務(wù)類(lèi)-智算平臺(tái)和云原生類(lèi)-云原生AI分別斬獲技術(shù)典型實(shí)踐獎(jiǎng)。
在智算云方面,金山云星流平臺(tái)針對(duì)AI落地中的算力異構(gòu)、數(shù)據(jù)治理低效與部署復(fù)雜等痛點(diǎn),構(gòu)建了訓(xùn)推一體化架構(gòu),通過(guò)算力動(dòng)態(tài)調(diào)度、多模態(tài)數(shù)據(jù)治理及輕量化推理部署技術(shù),實(shí)現(xiàn)了資源利用率與開(kāi)發(fā)效率的雙升。目前,該平臺(tái)已在具身智能、自動(dòng)駕駛等領(lǐng)域落地,有效助力企業(yè)降低開(kāi)發(fā)成本,加速其智能化轉(zhuǎn)型進(jìn)程。
金山云星流平臺(tái)核心優(yōu)勢(shì):
提供從模型開(kāi)發(fā)、訓(xùn)練到推理的完整生命周期管理;
智能匹配異構(gòu)算力資源與任務(wù)需求,保障GPU資源利用率;
集成分布式存儲(chǔ)系統(tǒng)與高速RDMA網(wǎng)絡(luò)架構(gòu),實(shí)現(xiàn)訓(xùn)練數(shù)據(jù)高速提取、模型參數(shù)高吞吐傳輸;
任務(wù)級(jí)可觀(guān)測(cè)能力覆蓋開(kāi)發(fā)、訓(xùn)練、推理全流程;
實(shí)時(shí)監(jiān)控硬件健康狀態(tài)與任務(wù)進(jìn)程,自動(dòng)觸發(fā)故障遷移與任務(wù)重調(diào)度,保障長(zhǎng)周期訓(xùn)練任務(wù)穩(wěn)定運(yùn)行;
提供細(xì)粒度角色權(quán)限控制、任務(wù)隔離及資產(chǎn)隔離功能,滿(mǎn)足多用戶(hù)權(quán)限控制場(chǎng)景的合規(guī)性要求。
在云原生方面,云原生AI套件以金山云容器服務(wù)為底座,結(jié)合大模型客戶(hù)實(shí)際業(yè)務(wù)的云原生化落地經(jīng)驗(yàn),支撐大模型訓(xùn)練及推理業(yè)務(wù)。該套件涵蓋異構(gòu)資源納管、AI負(fù)載調(diào)度、資產(chǎn)加速、智能運(yùn)維、資源觀(guān)測(cè)等開(kāi)箱即用的云原生組件,可在大模型場(chǎng)景下提供全鏈路能力支持。
云原生AI套件核心優(yōu)勢(shì):
統(tǒng)一接入和管理AI業(yè)務(wù)所依賴(lài)的IaaS資源,并標(biāo)準(zhǔn)化對(duì)接至KCE集群內(nèi),實(shí)現(xiàn)統(tǒng)一調(diào)度和運(yùn)維;
完全兼容原生Volcano,同時(shí)支持RDMA與GPU親和性拓?fù)湔{(diào)度、任務(wù)自愈優(yōu)先級(jí)調(diào)度、嚴(yán)格FIFO等高階調(diào)度策略,確保提升任務(wù)間通信效率、減少GPU資源碎片;
安卓APP式在集群一鍵部署熱門(mén)大模型服務(wù)。同時(shí)支持使用套件內(nèi)的分布式推理框架、鏡像/數(shù)據(jù)加速、智能網(wǎng)關(guān)等組件部署并暴露推理實(shí)例。
秒級(jí)感知集群GPU節(jié)點(diǎn)故障(140+Xid Error 、20+硬件故障),分鐘級(jí)完成故障自愈及熱備機(jī)替換,并支持按照業(yè)務(wù)定制化自愈流程;
提供AI任務(wù)依賴(lài)的多維度的全監(jiān)控指標(biāo)及日志輸出,確保大模型任務(wù)全鏈路透明。
AI浪潮奔涌向前,金山云將持續(xù)深耕技術(shù),在可信技術(shù)和數(shù)據(jù)安全領(lǐng)域持續(xù)發(fā)力,秉承更加開(kāi)放、協(xié)同的生態(tài)理念,以不斷深化的服務(wù)能力助力客戶(hù)數(shù)智化轉(zhuǎn)型。