
深大聯合華為滿血版 -R1上線
新學期,新氣象。開學第一周,深大全國產化、本地化部署的滿血版DeepSeek-R1(671B)正式上線!深圳大學大數據系統計算技術國家工程實驗室、深圳大學信息中心聯合華為基于昇騰平臺部署,滿血版DeepSeek-R1(671B)大模型為全校師生提供高效、穩定的本地化AI服務。
相較于蒸餾版模型滿血版DeepSeek-R1具備顯著優勢,性能更強:基于671B參數量級支持復雜邏輯推理與長文本深度交互,功能更全:支持私有知識庫融合,為教學科研提供定制化服務。
本地化部署01服務高可用性基于校內昇騰算力平臺(85P算力儲備),規避外部服務中斷風險,保障7x24小時穩定響應,滿足教學、科研及辦公的連續性需求。02數據隱私零泄露所有用戶問答數據僅限本地存儲,不用于任何模型優化或第三方共享,嚴格保障科研機密與個人隱私,為學術探索筑牢安全防線。03定制化服務擴展未來可快速接入校本知識庫(如學術資源、課程體系),打造“AI+教育”“AI+X科研”垂直領域解決方案,賦能學科交叉創新。
支撐平臺
大數據國家工程實驗室長期從事大模型理論及應用相關研究,2023年4月在LLaMA框架基礎上開源首個百億參數大規模中文語言模型伶荔(https://github.com/CVI-SZU/Linly),聯合騰訊續推出首個模塊化大語言模型訓練框架TencentPretrain(https://github.com/Tencent/TencentPretrain),大大推動了國內大語言模型技術的發展。在開源伶荔模型基礎上,相關團隊陸續推出了可以與人真實互動的2D/3D數字人與數字客服,人臉細粒度分析多模態大模型、病理/超聲/腹部CT多模態診斷大模型以及金融領域軟件需求分析大模型等垂直領域大模型。后續將在DeepSeek基礎上持續提升相關系統性能。
未來規劃
大數據國家工程實驗室正在承建深大自己的智算中心(投資超過一個億,算力達330PFlops),相關IT/GPU設備已經完成招標采購,機房建設正在緊鑼密鼓進行中。除了為全校師生教學科研提供算力服務,智算中心團隊將會把滿血版DeepSeek系列部署在高性能GPU上,提供安全可靠、數據隱私零泄露的國產化大模型服務!