清华瑞莱联合团队:“安全增强版DeepSeek”可为应用提供坚实基座

2025年02月25日 来源: 点击:

中新网北京2月24日电 (记者 张素)2月23日,清华大学与瑞莱智慧联合团队推出大语言模型RealSafe-R1。研发团队代表介绍说,实验数据表明RealSafe-R1安全性提升显著,“安全增强版DeepSeek”可为更多应用提供可靠坚实基座。

连日来,国产开源大模型DeepSeek的优异表现备受关注,其在自然语言处理和多任务推理方面的能力展现了强大的技术实力,尤其是在复杂问题解决和创造性任务中表现出色。业内专家同时提醒,DeepSeek R1和V3在面对一些安全性挑战时仍存在一定的局限性。

针对“安全对齐机制不足”这一当前开源大模型的通病,清华瑞莱联合团队提出基于模型自我提升的安全对齐方式。“大模型的安全性瓶颈是本质的,只有通过持续投入和攻坚补齐短板弱项,人工智能产业才能真正实现高质量发展。”瑞莱智慧首席执行官田天说。

据介绍,研发团队将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。具体来说,研发团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。

实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间“跷跷板”现象。有评论认为,这为开源大模型安全发展与风险治理提供了创新性解决方案。

田天表示,RealSafe-R1各尺寸模型及数据集,将于近期向全球开发者开源。他进一步指出,这一创新成果将为开源大模型的安全性加固提供有力支持,也为政务、金融、医疗等场景的应用提供更为可靠的坚实基座。(完)

相关文章
  • 奋进的春天丨“一座高水平现代化城市正在拔地而起,堪称奇迹”
    奋进的春天丨“一座高水平现代化城市正在拔地而起,堪称奇迹”

    2017年2月23日,习近平总书记专程到河北省安新县进行实地考察,主持召开河北雄安新区规划建设工作座谈会。如今,“一座高水平现代化城市正在拔地而起,堪称奇迹”。雄安新区的建设牵动着大家的心,习近平总书记更是在不同场合多次谈及雄安发展规划,掷地有...

  • 第15届凝聚态物质与极化中子研究国际会议在东莞举行
    第15届凝聚态物质与极化中子研究国际会议在东莞举行

    中新网东莞2月24日电 (许青青 张玮)第15届凝聚态物质与极化中子研究国际会议(简称PNCMI2025)在24日在广东东莞市举行,会议聚焦国内外极化中子平台的建设和极化中子在凝聚态物质研究中的最新应用,探讨极化中子领域的未来发展。会议现场。中国科学院高能物理研究...

  • 2025年中央一号文件发布
    2025年中央一号文件发布

    2025年中央一号文件2月23日发布《中共中央 国务院关于进一步深化农村改革 扎实推进乡村全面振兴的意见》提出以改革开放和科技创新为动力巩固和完善农村基本经营制度深入学习运用“千万工程”经验确保国家粮食安全确保不发生规模性返贫致贫提升乡村产业发展...

  • 《江西省公路条例》将施行 探索高速公路差异化收费
    《江西省公路条例》将施行 探索高速公路差异化收费

    中新网南昌2月24日电 (朱莹)24日,记者从江西省人大常委会办公厅举行的《江西省公路条例》(以下简称《条例》)新闻发布会上获悉,《条例》将于2025年3月1日起正式施行,将探索高速公路差异化收费。图为24日,江西省人大常委会办公厅举行《江西省公路条例》新闻...

  • 深圳政协委员热议人工智能 打造AI先锋城市
    深圳政协委员热议人工智能 打造AI先锋城市

    中新网深圳2月24日电 (记者 索有为)深圳市政协七届五次会议24日在深圳会堂开幕,近500名深圳市政协委员围绕深圳和社会关注的热点问题建言献策,人工智能成为委员们共同热议的话题。在当天上午的大会发言环节,深圳市政协委员、深圳市工商业联合会执委、深圳...

  • 全面检验舰炮实弹射击水平 查干湖舰、青海湖舰展开实战化支援训练
    全面检验舰炮实弹射击水平 查干湖舰、青海湖舰展开实战化支援训练

    近日,海军某支队组织查干湖舰、青海湖舰等多艘舰艇在南海某海域,展开多课目、高强度综合作战支援训练,锤炼部队全天候遂行任务能力。查干湖舰编队刚刚驶进训练海域,由靶机模拟的“敌”机突然发射升空,查干湖舰雷达部位发现附近空域有不明空中目标来...

友情链接