了解金山云最新資訊
2025-04-21 14:09:00
日前,金山云星流訓推平臺全面接入智譜GLM系列推理模型,為首批接入該系列推理模型的平臺之一。
聚焦高效部署與分布式推理協(xié)同,金山云星流訓推平臺提供從模型部署到調用的服務能力,通過智能任務調度與跨節(jié)點并行計算,該平臺可實現(xiàn)模型的高效推理。無需復雜配置,用戶即可在公有云環(huán)境構建穩(wěn)定、高性價比的模型服務。
金山云星流訓推平臺部署GLM系列推理模型流程:
1. 進入金山星流訓推平臺控制臺并創(chuàng)建資源池
2. 進入模型在線服務導航頁
3. 點擊新建,創(chuàng)建模型在線服務
a. 部署類型選擇模型部署
b. 選擇GLM系列推理模型,用戶可自主配置服務副本數(shù)
c. 填寫基本信息、資源、網絡等配置
d. 點擊確認,模型開始部署
*模型部署所需時間較長,請耐心等待
4. 調用模型服務
a. 支持內網、公網調用和在線調試
b. 支持WebUI調用模型
*用戶可根據(jù)需求選擇調用方式進行模型調用
32B/9B系列GLM模型是國產AI大模型獨角獸智譜于日前正式開源的,涵蓋基座、推理、沉思模型,均遵循 MIT 許可協(xié)議。
據(jù)悉,GLM-Z1-32B-0414是具有深度思考能力的推理模型,相較其32B基座模型提升了數(shù)理能力和解決復雜任務的能力。據(jù)智譜公開測試結果,在AIME 24/25、LiveCodeBench、GPQA 等基準測試中,GLM-Z1-32B-0414 在數(shù)理推理能力、指令遵循能力和綜合工具調用能力等方面表現(xiàn)突出。沿用了上述一系列技術,智譜還訓練了一個9B的小尺寸模型。據(jù)智譜公開數(shù)據(jù),該小尺寸模型雖然參數(shù)量更少,但是在數(shù)學推理及通用任務上依然表現(xiàn)優(yōu)異。
此前,金山云星流訓推平臺已完成DeepSeek等多款大模型部署。通過接入更多優(yōu)質大模型,金山云將為各領域客戶提供更加高效、智能和更具性價比的模型服務。