都市时报数字报 > 2025-09-17 >A04
国内首次AI大模型安全“体检”结果出炉
15款大模型及应用产品接受测试
     发布时间:2025-09-17
字体大小
  众测结果发布现场 供图


  ■ 都市时报全媒体记者 郑荣行

  9月16日,在第22届中国网络安全年会(暨国家网络安全宣传周网络安全协同防御分论坛)上,国内首次针对人工智能大模型的实网众测检验结果正式发布,大模型特有漏洞177个,占比超过60%。

  本次活动累计发现

  各类安全漏洞281个

  此次活动由中央网信办网络安全协调局指导,国家计算机网络应急技术处理协调中心主办,相关平台和基地提供技术支持。活动发布了国内首次针对AI大模型的实网众测检验结果,共动员559名白帽子,对国内15款大模型及应用产品进行了全面漏洞测试。测试产品涵盖基础大模型、垂域大模型、智能体、模型开发平台等多种类型,既包含单模态大模型,也涵盖多模态大模型,具有广泛的代表性。

  从结果来看,腾讯混元大模型、百度文心一言、阿里巴巴通义App、智谱华章智谱清言等产品发现的漏洞风险较少,展现出较高安全防护水平。活动还涌现出梁宏宇、马宝新、刘铭等一批优秀白帽子,他们涵盖网安企业人才、科研院校师生及社会人士,从外部攻击者视角完成多维度实战化测试,即便在厂商防护下仍挖掘出高危及严重等级漏洞,彰显专业能力与奉献情怀。

  值得关注的是,本次活动累计发现各类安全漏洞281个,其中,大模型特有漏洞177个,占比超60%,凸显AI大模型面临传统安全领域之外的新兴风险。典型漏洞风险包括部分产品不当输出类漏洞危害严重、信息泄露类漏洞多发、提示注入类漏洞普遍、无限制消耗类攻击防护不足及传统安全漏洞仍存等。鉴于AI大模型用户量大、使用率高,此类漏洞若被恶意利用,将严重影响国内AI大模型产品生态。

  建议加快制定

  AI漏洞分类分级标准

  对此,活动明确AI大模型安全治理需各方发力,持续加强安全防护措施应对各类漏洞风险,加快制定AI漏洞分类分级及场景风险等级标准,通过众测模式汇聚社会白帽力量构筑共治生态,加强内生安全治理,并将安全融入AI系统全生命周期。

  业内人士指出,随着人工智能应用场景不断拓展,新的风险和攻击方式仍将持续出现,AI大模型安全治理工作任重道远,亟需各方共同努力,从源头筑牢安全基石。