GPTSecurity

「塑造未来的安全领域智能革命」

【论文速读】| ARVO: 开源软件可重现漏洞的全景图

本次分享论文:ARVO: Atlas of Reproducible Vulnerabilities for Open Source Software 基本信息 原文作者:Xiang Mei, Pulkit Singh Singaria, Jordi Del Castillo, Haoran Xi, Abdelouahab (Habs) Benchikh, Tiffany Bao, ...

【论文速读】| 基于大语言模型智能体对文本到图像模型进行越狱

本次分享论文:Jailbreaking Text-to-Image Models with LLM-Based Agents 基本信息 原文作者: Yingkai Dong, Zheng Li, Xiangtao Meng, Ning Yu, Shanqing Guo 作者单位: 山东大学, CISPA Helmholtz Center for Information Securi...

【论文速读】| SEAS:大语言模型的自进化对抗性安全优化

本次分享论文:SEAS: Self-Evolving Adversarial Safety Optimization for Large Language Models 基本信息 原文作者: Muxi Diao, Rumei Li, Shiyang Liu, Guogang Liao, Jingang Wang, Xunliang Cai, Weiran Xu 作者单位: 北京邮电...

“AI+Security”系列第2期(五):大模型自身安全

(加入“安全极客”知识星球,获取分享PPT等干货内容) 近日,由安全极客、Wisemodel 社区与 InForSec 网络安全研究国际学术论坛联合主办的 “AI+Security” 系列第二期 —— 对抗!大模型自身安全的攻防博弈线上活动如期举行。 在圆桌环节,君同未来创始人兼 CEO 韩蒙、前阿里云高级安全专家郑瀚、ChaMd5 AI 组负责人宁宇飞、始智 AI wisemodel...

第65期|GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。在这里,您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令(Prompts)。现为了更好地知悉近一周的贡献内容,现总结如下。 Security Papers 基...