浙大联合华为发布开源安全大模型DeepSeek-R1安全版,引领AI安全新篇章
浙江大学联合华为发布开源安全大模型DeepSeek-R1-Safe,旨在提高人工智能系统的安全性和可靠性,该模型具备强大的自然语言处理和文本分析能力,可广泛应用于网络安全、风险评估和隐私保护等领域,DeepSeek-R1-Safe的开源性质有助于促进技术共享和创新,推动人工智能领域的安全发展,该模型的发布将为相关行业提供重要的技术支持和解决方案。
浙江大学网络空间安全学院联合华为公司,推出了 deepseek r1 模型的安全增强版本——deepseek-r1-safe。


该模型基于华为昇腾AI芯片及 MindSpeedLLM 等技术框架进行研发,完整训练流程包括以下关键步骤:
- 数据集构建:生成符合安全规范与合规要求的高质量训练数据
- 安全监督微调:在训练中嵌入安全对齐机制,引导模型输出合规内容
- 安全强化学习:采用 RLHF 等先进方法进一步优化模型行为策略
- 综合性能评估:全面测试模型在安全性与通用能力方面的表现
该版本在大幅提升内容安全防护水平的同时,充分保留了原模型的通用智能能力,实现了安全性与实用性的良好兼顾。

开源地址:https://www.php.cn/link/bf30380c97b6862a8c0d48cc21c09bbf
源码下载:点击获取
下一篇 >>
网友留言(0 条)