9月15日,2025年广东省网络安全宣传周开幕式在珠海举行。会上,中国工程院院士方滨兴以《大模型保险箍:大模型护栏的一种模式》为主题作主旨演讲,介绍了当前大模型安全合规风险与挑战,强调大模型安全护栏的必要性,重点分享了其团队提出的大模型安全合规的“保险箍”模式的实践与持续研发情况。
什么是大模型护栏?方滨兴表示,用户向大模型提出问题,护栏对大模型形成的答案进行审核。“我们把护栏看作一种卸压阀,保证输出内容符合伦理道德和法律规范。”方滨兴团队研发的大模型保险箍是护栏的一种具体实践,并实现从输入端拦截,对恶意诱导以及明显偏激生成违法不良信息的问题拒绝回答。此外,结合广东地区粤语特色,大模型保险箍可以实现对普通话和粤语问题进行快速分类和敏感词过滤。
方滨兴提出,应构建通用化护卫模式,将安全能力作为国家级基础设施服务,由专业平台统一提供。这种模式通过集约化建设安全基座,可避免企业重复投入安全资源,降低全社会网络安全建设成本,有效应对大模型应用引发的系统性风险。
南方网、粤学习记者 李润芳