信息安全知识库 vipread.com - EasyRSS

首页 RSS源订阅博客

信息安全知识库 vipread.com

信息安全知识库信息安全资料,等级保护资料,信息安全资料下载,信息安全实验资料 ,vipread,信息安全,安全文档,文档报告,文档分享,会议资料,安全加固

https://vipread.com

AI智能体从思考规划到落地执行的安全赋能之旅

本文链接《AI智能体：从思考规划到落地执行的安全赋能之旅》由安恒信息王欣主讲，系统描绘了AI Agent 从“会聊天”到“会做事”的跃迁路径：通过恒脑大模型+300+安全插件的编排，形成可视化报告、代码审计、钓鱼研判、数据分类分级等10大“硅基员工”，把14天等保报告缩短至2人天、告警研判效率提升93%。报告以Manus全球Agent商用化趋势为例，强调“记忆-规划-工具-反思”闭环让安全运营从人力密集转向智能托管；并预判2025年Agent将成为安全产业标配，重塑攻防协同、RPA流程、自适应架构与合规审核，实现知识经验平台化、一线专家超级个体化。王欣详细介绍安恒信息在 AI 智能体的布局和发展历程。他表示，智能体与网络安全体系的融合将是未来的发展趋势，而非孤立存在。通过引入智能中台，将数据、知识、情报及安全产品整合为 Agent 的一部分，实现任务的调度与执行，来应对各类安全场景。预计在未来 3-5 年内，这种模式将成为面向客户侧的主要发展方向，提升整体安全效能和响应速度。接着，王欣分享 AI 智能体给行业带来的变革：第一，Agent 的引入标志着安全运营从量变到质变的过程，技术发展需要一定的周期；第二，智能体的出现使得业务专家从专才转变为超级个体，通过减少辅助工程和岗位，让专家的知识经验成为核心，未来逐步出现一人当岗、一人多能的情况，并利用编排系统将个人经验沉淀为平台经验，以完成更多任务。最后，王欣回顾了过去一年对 AI 智能体在安全领域的八个预测，例如 Agent 将成为产业标配，AI native 工具将成为 Agent 的手和脚；ASA 架构将在 AI 智能体影响下升级等等，他指出，部分预测可能未能完全符合实际发展轨迹，并提出今年将重新审视相关趋势，依托更严谨的分析框架与数据支撑体系，结合对技术演进的深度洞察，探索实现类似 AI 级精准预测的可能性。 https://mp.weixin.qq.com/s/6rlyOEhF1CkX7Kvnj4ZISw

信息安全知识库 vipread.com

2 个月前

AI赋能的未来安全创新趋势和实践探索

本文链接《AI赋能的未来安全》由深信服张振礼主讲，提出“安全AGI”四阶段演进路线：从单点ChatBot到智能体闭环，最终让AI承担95%安全运营。报告详解深信服800张A100、400+硕博打造的千亿级安全大模型体系，结合RAG、微调、智能体编排，把钓鱼邮件、Web攻击、数据泄露、UEBA异常等场景做成开箱即用的“安全GPT”。通过2024HW实战验证，实现100%告警自动研判、工单自动下发、漏洞整改闭环，真正把大模型从“聊天玩具”变成“值守同事”。面向未来，倡议用AI原生应用替代传统工具，让安全团队从重复沟通中解放，聚焦高阶决策。张振礼先是分享对 AI 赋能安全的理解：第一，安全本来就碎片化，不能每个安全 GPT 场景单独的模型分开部署，要统一规划，通过良好的架构设计实现各类大模型算力的统一调度和适配；第二，基础大模型持续进化，安全大模型需要具备快速融合、集成、吸收优秀基础模型的知识和推理能力，智能体的元年开启，持续为安全场景带来体验和效果的改进；第三，安全团队在 AI 时代要具备 RAG、微调等技能；四是开放性，AI 时代，安全产品需具备适应性以匹配不同行业的具体场景需求。张振礼表示，网络安全是一个对检出率、准确率有极高追求的 toB 领域，将任何的开源基座大模型落地于安全领域，都绝非简单的接入、缝合，而是一个复杂的系统工程。比如 DeepSeek 在安全垂直领域商业落地，必须具有安全垂域大模型的实践数据、对基座模型的安全场景驯化经验、面向安全业务的 AI 系统工程，才能强化优势，应对挑战。我们需经过指令微调、预训练及强化学习三个阶段，并结合专业经验和安全语料进行优化，才能适应特定安全场景需求。张振礼将 DeepSeek、GPT-4.5 等通用大模型比作安全“本科生”，通过安全指令微调和安全细分领域优化，这些模型成长为“硕士”，经过系统化的构建与实际应用验证，它们将成为“博士”或有经验的安全专家。接着，张振礼分享深信服 AI 安全的落地实践。如团队开发基于 AI 的安全助手，不仅改善安全管理，还优化安全规范及日常沟通，实现从被动响应到主动审计的转变，并推动全面自动化。此外，团队还提供 AI 安全培训体系，以增强大家的安全能力和安全技能。谈及未来，张振礼表示，从长远来看，随着多智能体协同技术的发展，安全行业将实现高度自动化，形成人监督机器等的新模式，释放更多人力资源去处理更有价值的任务。 https://mp.weixin.qq.com/s/6rlyOEhF1CkX7Kvnj4ZISw

信息安全知识库 vipread.com

2 个月前

AI 系统的安全风险和挑战

本文链接《AI系统的安全风险和挑战》由CertiK AI安全监管与治理专家李康撰写，聚焦大模型时代“系统级”威胁。报告先以欧盟AI法案风险金字塔为框架，剖析近期字节跳动实习生投毒、DeepSeek数据库泄露、ShadowRay等真实事件，指出AI Agent浪潮下传统漏洞（RCE、供应链投毒、对抗样本）与新型风险（沙箱逃逸、物理世界攻击）并存。通过GPT-Academic、Invoke AI等沙箱绕过案例，演示攻击者如何利用模型加载、文件解析、任务执行链实现远程控制；并以Tesla FSD闯红灯攻击为例，警示物理AI Agent的安全边界。最后呼吁在“AI平权”趋势下，安全监管必须超越传统网络安全假设，建立覆盖模型、数据、运行环境、物理交互的全栈治理体系。 Certik 首席安全官李康在《AI 系统的安全风险和挑战》的主题演讲中，谈到目前 AI 安全讨论通常集中在抽象层面（如 AI 对人类社会的威胁）和算法层面，但忽略系统安全层面的重要性和紧迫性，如今，AI 智能体的普及带来新的安全挑战，这些智能体带有执行环境，允许代码执行，这为攻击者提供机会。李康举例如何利用传统安全手段攻击 AI 智能体，通过简单的手段如命令注入、越权访问等，可轻易地对 AI 智能体进行攻击。 “攻击者并不一定针对AI的偏见或利用Prompt和幻觉进行攻击智能体，而是寻找有价值的目标，并用最简单的方式达成目的，当前AI的安全监管和检测尚未充分考虑这一点，未来需关注具体事件的爆发以应对这些潜在威胁。”李康提醒说。随后，李康进一步分析物理世界中的 AI Agent 同样面临安全风险，阐述 AI 系统在现实世界中的安全隐患。李康表示，AI Agent 为安全研究带来机会与责任，既让我们重新审视和应用过去的安全手段进行防护，同时也要求我们在发现攻击路径和方法上进行创新，尤其是在面对真实场景时，不依赖传统的直接互动方式。李康提醒道，AI 的普及不仅带来技术平权，也引入新的安全风险，希望安全从业者获得更多话语权和重视，尤其是在监管层面应更加关注底层安全问题。最后，李康呼吁更多人参与到 AI 安全的研究和实践中来。 https://mp.weixin.qq.com/s/6rlyOEhF1CkX7Kvnj4ZISw

信息安全知识库 vipread.com

2 个月前

安全大模型发展路径洞察与实践

本文链接《安全大模型发展路径洞察与实践》由360集团CTO潘剑锋主讲，提出“快思考-深度思考-慢思考”三级跃迁模型：先用统计性快思考解决告警降噪、钓鱼识别等高频任务，再借CoE多专家架构与Agentic Workflow实现复杂威胁狩猎的“慢思考”。依托360百亿级终端与网络攻防语料，CCoE模型在52个恶意家族检测中全面超越GPT-4；并通过“思想钢印”记忆机制与蒙特卡洛树搜索，持续沉淀专家经验，驱动终端、流量、云、浏览器全线产品升级。报告最终呼吁以安全大模型重塑攻防思维模式，迈向“AI即安全服务”新时代。潘剑锋先是讨论大模型的理解能力，引入“快慢思考”概念来评估当前大模型的能力。他表示目前大模型的价值是很好地模拟人脑的“快思考”，即大模型通过海量数据训练，做文字符号层面的统计处理，从数据中找出统计性规律，在概括的意义上掌握学习样本所反映的隐含知识，并以此为基础生成内容。而“慢思考”需要对事物具有本质性理解，需借助事实性知识，通过多步推理、反思，是“深思熟虑”的结晶。针对慢思考任务的场景中，当前可编排专家经验，整合安全大模型、知识库、工具库的能力，实现半自主的推理 Agent。当前，国内大模型赋能安全产品主要采用两种不同层次的方式：一是直接使用通用大模型的能力实现安全应用；二是应用安全垂直大模型。这两种方式之间的区别就像“一个博学的人拿着医科全书”与“主任医师”，前者虽然能够查到专业知识，但是不能够贯通运用；后者是具有丰富的临床实践经验。安全垂直大模型能够将专业的安全数据真正训练进入模型中。潘剑锋分享如何基于以上理论进行落地实践，包括安全语料生产、模型分区训练和慢思考实现方式。高质量的安全语料被视为行业的护城河，360 首创的 CoE 技术架构允许不同的安全专家分区训练各自的模型，有效减少多任务冲突、过拟合等问题，保证训练效果同时降低资源消耗。潘剑锋目前基于推理时计算扩展的方法，在外延方面进行创新，还尝试做本质性理解的相关工作。通过团队的持续探索，有望进一步提升大模型在安全领域的效能与适用范围，寻找新的发展范式。 https://mp.weixin.qq.com/s/6rlyOEhF1CkX7Kvnj4ZISw

信息安全知识库 vipread.com

2 个月前

安全领域大模型构建范式与实践

本文链接《安全领域大模型构建范式与实践》由腾讯安全科恩实验室吴石主讲，提出“高质量语料 + 科学评测”双轮驱动范式：自建SecCorpus对20 B token清洗去噪，使160 M小模型即达通用1.8 B效果；发布SecBench平台，5万道题覆盖证书、问答与攻防场景，为行业首套安全大模型评测基线。实践上，以混元+BinaryAI亿级函数向量RAG为核心，打造Security-X研判助手，输入IOC即可自动生成多智能体协同的综合报告，日调用破亿。报告总结：大模型落地需“数据-评测-场景”闭环，科恩已把AI能力嵌入腾讯云、iOA、电脑管家全线产品，实现精准威胁识别与智能运营。自 2018 年起，科恩实验室开始对 AI+ 安全的研究，致力探索如何提升安全产品的智能化水平，落地相关产品，腾讯内部包含 QQ、微信在内的多个重要产品均在使用科恩实验室 AI+ 安全的能力。当前在利用大模型解决实际安全问题上仍面临一些挑战，主要原因在于大模型本身并不产生新的知识，对于安全领域的专业知识掌握有限，导致其输出的实际效用不高。对此，吴石分享了科恩实验室在这方面所开展的工作：一是建立安全语料库，通过从多源收集数据并利用关键词过滤和分列器进行初步筛选，经过一系列数据清洗步骤，最终完成数据质量评测，目前此安全语料已部分开源。二是开发针对大模型安全能力的评测体系，填补行业空白，并部分开源评测工具，显著提升行业标准。吴石介绍腾讯内部如何落地大模型+安全：首先通过优化 prompt 提高提问质量，解决大部分基础问题；其次，利用外挂的知识库和数据库增强大模型的能力，实现快速反应；还有，开发 Agent 来提升处理复杂任务的能力。其中，科恩实验室自研 BinaryAI 可以模糊匹配开源库信息识别恶意代码，现日调用量超 1 亿次。基于RAG的 Security-X 助手广泛应用于 URL 处理、威胁情报检索等场景。总的来说，科恩实验室具备三大核心能力：优秀的安全攻防技术、全面的基础安全大数据以及自安全算法，这些为大模型的应用提供坚实基础，并推动通用大模型与小模型的有效结合。吴石指出，大模型作为网络安全领域的重要技术力量，已显著提升了威胁检测效率与安全防护能力，尤其在复杂场景中展现出独特价值。然而，当前技术范式下仍需理性看待其局限性：大模型在处理低频威胁、对抗性样本防御及实时决策场景中仍存在性能瓶颈。他强调，安全工作的核心仍需回归对抗本质——通过构建高保真威胁情报体系与攻击成本动态评估机制，迫使攻击者在技术、资源与时间维度付出更高代价。 https://mp.weixin.qq.com/s/6rlyOEhF1CkX7Kvnj4ZISw

信息安全知识库 vipread.com

2 个月前

大模型应用落地安全风险和防护实践

本文链接《大模型应用落地安全风险和防护实践》由火山引擎郑炎亭主讲，聚焦后DeepSeek时代的真实攻防：提示词越狱、RAG数据窃取、Log4j 诱导RCE、算力DDoS、幻觉误导五大高危场景，并给出从接入层到训练层的全栈防护方案——大模型应用防火墙+密文RAG+熔断限流+幻觉检测。报告强调，AI已进生产核心，安全即业务连续性，防护目标正从合规转向核心资产保险。火山引擎大模型应用防火墙产品负责人郑炎亭在《大模型应用落地的安全风险与防护实践》的分享中，探讨大模型应用在各行各业落地过程中面临的安全风险及相应的防护实践。郑炎亭观察到，过去，不同行业在引入新技术时注重快速验证和部署，安全往往被视为次要考虑因素。随着 DeepSeek 等工具的普及，AI 技术的成本降低、门槛变低，越来越多的企业开始重视 AI 应用的安全性，特别是在生产环境暴露面增大后带来的潜在威胁。当前的安全挑战不仅包括传统的 DDoS 攻击、薅羊毛滥用等，还涉及大模型特有的风险，如提示词注入、模型幻觉等问题。以提示词注入为例，通过简单的拼接即可实现对模型的操控，使得攻击成本大幅降低，这对企业的数据安全构成严重威胁。为应对这些挑战，郑炎亭提出一些实践思路：一是对提示词过滤与监控，对输入输出实施严格过滤，减少恶意利用的可能性。二是对运行环境做安全保障，使用加密技术和机密计算来保护敏感信息处理过程中的安全性。三是模型安全性测评，测试模型识别并拒绝执行恶意代码或生成有害内容。郑炎亭谈到大模型的幻觉问题确实不易解决。大模型幻觉分为事实性幻觉和忠实性幻觉。对于不同的幻觉应设计不同的应对方案，郑炎亭介绍几种在推理端处理幻觉问题的方法，强调在推理端更具性价比且更可控。 https://mp.weixin.qq.com/s/6rlyOEhF1CkX7Kvnj4ZISw

信息安全知识库 vipread.com

2 个月前

XCon x HG议题数字人安全

本文链接《XCon×HG议题：数字人安全攻防白皮书》系统梳理了数字人直播、AI伴侣到元宇宙应用的完整生态架构，揭示提示词注入、TTS语音伪装、Deepfake身份伪造、供应链投毒等十大攻击面及真实案例；并给出覆盖模型、数据、内容、应用到基础设施的五层防御体系，为企业在爆发式增长中守住品牌、资金与合规红线。

信息安全知识库 vipread.com

2 个月前

Prompt hacks guide

本文链接《Prompt Hacks：终极指南》系统梳理了生成式 AI 面临的提示注入、越狱等攻击手法，并给出10类威胁模型与对应防御方案。文件揭示了 LLM 无法区分系统指令与用户输入的根本原因，展示攻击者如何通过角色扮演、故事编造、编码混淆、令牌注入等方式窃取数据或输出有害内容；同时提供红队演练、语义防火墙、实时观测、合规审计等落地策略，帮助企业守护品牌、资金与运营安全。NeuralTrust 的 AI Gateway、自动化红队、可观测平台三大工具贯穿始终，为零信任架构下的 AI 部署提供一站式解决方案。

信息安全知识库 vipread.com

2 个月前

【西湖论剑gcsis.cn】汪玉凯：新质生产力与数字经济

本文链接汪玉凯教授在《西湖论剑》指出：数字经济正成为新质生产力的核心引擎，其关键在于平台、数据、互联共享三大新要素的协同放大。报告聚焦“制造强国”主战场，提出以“人工智能+工业互联网”提升智能制造水平；通过数据要素“流动—交易—价值实现”五大主体闭环，释放倍增效应；同时警示网络安全与算力一体化仍是瓶颈。政府应回归法治与政策营造，让市场与民营企业担当主角，方能在2025年把数字经济占比从当前水平拉升至10%。

信息安全知识库 vipread.com

2 个月前

【西湖论剑gcsis.cn】-大力发展AI 推动绿色化数字化协同转型

本文链接龚克在《西湖论剑》提出：以人工智能为“使能技术”，在信创安全底座之上实现绿色化与数字化协同转型。报告呼应联合国“AI for SDGs”决议，强调大模型即服务（MaaS）降低门槛，通过智能监测、治理、决策重塑能源、制造、环保全链条；同时以信创自主可控保障数据与模型安全，助力中国抢占绿色新质生产力制高点。

信息安全知识库 vipread.com

2 个月前

【西湖论剑gcsis.cn】-以数据为关键要素的数字经济亟需数字生态系统底层驱动范式转型

本文链接邬江兴院士指出，数字经济时代数据成为关键生产要素，但“存储程序控制”的先天基因缺陷使网络空间安全威胁愈演愈烈。为此提出中国原创的“内生安全+拟态防御”范式：通过动态异构冗余（DHR）构造，把未知漏洞扰动转化为可控概率问题，实现设计安全、默认安全、开箱即用。六年全球众测证明，采用内生安全架构的产品均未攻破，已纳入11项通信行业标准，成为数字生态底层驱动范式转型的“钢筋骨架”。

信息安全知识库 vipread.com

2 个月前

【西湖论剑gcsis.cn】-AI+安全，智绘跨时代的数字“富春山居图”

本文链接安恒信息范渊在2024西湖论剑提出“AI+安全”全景方案：以恒脑大模型与隐私计算为底座，打通数据“供得出、流得动、用得好”全链路；AI分类分级效率提升30倍，隐私计算让跨域数据“可用不可见”。AI安全智能体在亚运、大运实战中告警处置效率提升200%，实现“智能辅助驾驶”式运营。同时发布生成式AI安全防御框架，覆盖训练、部署、运营全周期风险治理，为企业数字化与绿色化协同转型保驾护航。

信息安全知识库 vipread.com

2 个月前

【西湖论剑gcsis.cn】-迎接人工智能的安全挑战

本文链接报告以“AI是新质生产力”为主线，指出算力、模型、数据、应用正形成指数级放大效应，同时带来幻觉、伦理、攻防失控三大安全新图景。中国提出“全球共治、分级韧性”治理思路，将IT→DT→AI驱动的安全演进划分为三个阶段，倡导用AI提升自身安全、用韧性框架保障AI发展，并发布联合国首个人工智能全球决议，为强国建设与民族复兴守住底线、抓住机遇。

信息安全知识库 vipread.com

2 个月前

在幻觉与超能中前行-⼤模型参与安全运营的应⽤探索

本文链接传统安全运营正面临巨大的挑战，过度依赖专家团队，人力资源和知识有限等问题尤为突出。碳基生命的生理极限决定了在未来网络安全攻防战场，单纯依靠传统安全工具和方法是无法赢得战争的，必须借助当前最前沿的人工智能技术。本议题将重点分享多个安全运营场景中使用大模型技术改进和增强现有的安全运营工作机制，全面提升安全运营的水准，包括：如果充分发挥智能体、大模型生成能力、编码能力实现几十倍甚至上百倍的运营效率提升。当然，大模型的应用并非没有挑战，尤其是“幻觉”问题——即大模型在某些情况下可能会做出错误的推理和判断，从而导致误报或漏报。本议题在讨论大模型应用安全运营场景时，还将介绍作者所在团队过去的一些技术尝试，介绍如何克服“幻觉”问题，降低AI出错的概率，让大模型给出更加精准和可靠的决策结果。通过对这些技术细节的深入分析，旨在帮助与会者理解大模型在安全运营中的实际应用价值，并展望其未来的发展方向。

信息安全知识库 vipread.com

2 个月前

LLM越狱攻击与防御框架

本文链接《LLM越狱攻击预防与框架 v3.3》系统梳理了大语言模型从指令注入到多模态对抗、表征工程到智能体工具滥用的全部越狱路径，配套可落地的防御体系（对齐-检测-沙箱-监控）。文档以威胁模型为纲，将攻击按提示工程、输出结构、优化、模糊、组合、MCP滥用六大类拆解，并提供测试脚本与红队演练方案，帮助安全团队在模型全生命周期内快速定位脆弱点、迭代加固。适用于AI产品、红队及合规审计人员。

信息安全知识库 vipread.com

2 个月前

Hype Cycle for Security Operations, 2025

本文链接 Gartner《2025安全运营成熟度曲线》系统梳理了从漏洞管理到持续威胁暴露管理（CTEM）的演进路径，突出AI SOC代理、暴露评估平台（EAP）、对抗性暴露验证（AEV）等前沿技术的成熟度与商业价值。报告强调将传统资产可见性、威胁检测与响应、身份威胁检测与响应、网络检测与响应等能力整合为可编排、可度量的运营体系，以应对云原生、混合办公及CPS（网络-物理系统）带来的新攻击面。同时提供优先级矩阵，帮助企业在2年内快速落地高价值场景，或在5-10年内布局变革性架构如网络安全网格（CSMA）。

信息安全知识库 vipread.com

2 个月前

人工智能和数据保护培训课程之使用个人数据的安全AI系统基础知识

本文链接本书是欧盟“支持专家库”项目官方教材，专为AI、隐私与网络安全交叉人才写作。全书以MLOps生命周期为主线，系统讲解如何在训练、部署、监控AI系统的每个环节同时满足《人工智能法案》与GDPR要求：从隐私增强技术（差分隐私、联邦学习、合成数据等）到安全代码开发、模型测试、可信运行环境。书中用大量案例与练习帮助企业在处理个人数据时降低法律与伦理风险，实现“高性能+高合规”的AI落地。

信息安全知识库 vipread.com

2 个月前

AI Agents for Offsec with Zero False Positives

本文链接本文是Black Hat USA 2025议题《AI Agents for Offsec with Zero False Positives》的讲稿，作者Brendan Dolan-Gavitt提出“AI代理+确定性验证”方案，解决传统LLM在漏洞挖掘中的高误报难题。通过“证据-验证”双阶段流程：LLM先定位可疑点，再用非AI脚本（flag回显、时延差异、缓存投毒等）进行可复现验证，已在Docker Hub 2500万镜像扫描中捕获174个漏洞、22个CVE，误报率趋近零。文中给出Redmine权限绕过、Druid SSRF、MapProxy文件读取等实战案例，并开源自动化工具链，为大规模安全测试提供新范式。

信息安全知识库 vipread.com

2 个月前

LLM&Agent安全防护实战-业务落地视角下的风险管控与解决方案

本文链接文稿深入探讨了随着大型语言模型（LLM）与AI智能体（Agent）能力日益强大，所带来的严峻安全挑战。报告指出了几大核心风险领域：有害内容输出：模型可能被诱导生成歧视性或极端的有害言论。数据与隐私泄露：系统提示（System Prompt）和个人身份信息（PII）面临泄露风险。攻击者可通过路径遍历等手段实现数据越权访问。目标劫持：通过间接注入恶意指令，改变Agent的原定功能，例如让应用只推荐特定商家。网络与系统攻击：模型可被用于生成恶意代码（如类似WannaCry功能的代码），或被利用触发远程代码执行。资源滥用：恶意用户可通过循环调用工具等方式，大量消耗模型的计算资源，造成拒绝服务。这些风险源于模型指令遵循、泛化、推理等能力的提升。为应对这些挑战，报告提出了一套多层次的Agent安全设计框架。该框架以模型安全对齐为基础，通过对齐算法（SFT, RL）和数据，使LLM具备基本的安全与权限意识。在此之上，通过Agent框架层面的安全设计，如Prompt优化、角色权限管控等进行加固。最后，设置输入输出过滤作为兜底策略，拦截恶意内容。

信息安全知识库 vipread.com

2 个月前

AI Agent应用攻击面漫谈

本文链接该报告深入探讨了AI Agent应用面临的攻击面。首先，报告概述了AI Agent的定义、决策流程（感知、规划、行动）和关键特性（自主性、适应性等），并介绍了其在客服、办公助手等领域的广泛应用。其核心技术架构由大型语言模型（Model）、代理运行时（Agent Runtime）、功能工具（Tools）以及底层支持服务（Supporting Services）构成。报告的核心部分详细剖析了AI Agent各组件的潜在安全风险。 1. 大型语言模型（LLMs）：主要面临提示词注入攻击，攻击者可通过直接或间接方式注入恶意指令，从而操控Agent执行非预期的操作，如窃取数据或执行恶意代码。报告强调，不仅用户输入不可信，模型生成的内容同样需要被视为不可信来源。 2. 消息传输：以WebSocket为例，若缺乏正确的安全配置（如Origin校验），易遭受跨站WebSocket劫持（CSWSH），导致聊天数据被窃取。 3. 输入与输出处理：对模型生成内容的处理不当会引发严重漏洞。例如，直接执行模型生成的代码可能导致远程代码执行（RCE），而将模型输出渲染为HTML则可能造成跨站脚本（XSS）攻击。 4. 工具（Tools）：作为Agent与外部世界交互的桥梁，工具是风险最集中的区域。数据分析功能可能导致代码执行，网页访问功能可能引发服务端请求伪造（SSRF），数据库操作则可能存在SQL注入风险。 5. 沙盒环境：用于执行代码的沙盒若配置不当，如网络或文件系统隔离存在缺陷，攻击者可能实现沙盒逃逸，进一步危害宿主系统。最后，报告对未来防御方向进行了展望，提出了三大关键策略：遵循最小权限原则限制Agent能力；通过动态监控实时追踪并拦截Agent的异常意图与行为；以及将传统应用安全与大模型安全相结合，构建纵深防御体系。

信息安全知识库 vipread.com

2 个月前

LLM 间接提示注入漏洞解析与防御路线

本文链接演示首先概述了LLM面临的普遍安全风险，并引用OWASP的报告，强调“提示注入”是首要威胁。近期多所国际知名大学的论文被发现植入了操控AI给出好评的隐形指令，这便是提示注入的实例。研究数据表明，与直接提示注入相比，间接提示注入（IPI）的攻击成功率要高得多，因为它将恶意指令隐藏在模型处理的网页、文档等外部内容中，模型在解析时会自动执行。接着，文稿深入分析了IPI的攻击原理。其有效性的关键在于模型本身无法区分“指令”和“数据”，且缺乏“不执行外部数据中指令”的意识。实证研究表明，即使是更强大的模型，也普遍受IPI影响，且攻击成功率更高，而现有的缓解技术（如提示工程和微调）虽有改善，但效果有限，并可能牺牲模型的实用性。为了说明其危害，文稿展示了一个真实的攻击链条：攻击者将恶意指令（如窃取历史对话、钓鱼用户凭据）植入PDF文档中。当用户上传该文档让AI进行翻译或总结时，AI会执行恶意指令，将用户的历史对话记录发送到攻击者服务器，或生成一个仿冒的登录页面来骗取用户账号密码。测试显示，国内外多款主流大模型均存在此类风险。最后，针对IPI攻击，演示提出了一个由输入过滤、指令结构强化和模型自身调优构成的纵深防御体系。具体措施包括：在模型处理输入前进行恶意指令检测；在架构上明确区分系统指令、用户指令和外部内容；以及通过安全增强微调，提升模型自身区分指令与数据的能力。

信息安全知识库 vipread.com

2 个月前

火山引擎AI安全保障实践-曲乐炜

本文链接这份文档详细介绍了火山引擎在AI领域的安全保障实践。首先，文档概述了火山引擎的AI业务架构，该架构涵盖了从底层AI基础设施（AI Infra）、大模型服务平台（MaaS）到智能体开发运维（Agent DevOps）和最终的AI智能体（AI Agent）应用的全方位服务。文档的核心部分阐述了火山引擎的AI安全保障方案，强调“安全是一切Agent的基础”。该方案构建了一个多层次的纵深防御体系，包括针对大语言模型（LLM）本身的提示词攻击防护、模型平台安全；针对Agent和工具的协议安全、沙箱防护；以及覆盖底层基础设施和平台治理的全面安全措施。文档重点分析了AI智能体场景中MCP（Model-as-a-Service Connector Protocol）面临的七大核心安全风险，例如传统的Web服务漏洞、工具描述投毒、间接提示词注入、恶意“地毯式骗局”（Rug Pull）以及企业数据安全风险等。为应对这些挑战，火山引擎设计了MCP安全架构。该架构包含三大核心策略：第一，严格的安全准入控制，确保所有接入MCP市场的服务都经过安全扫描和漏洞修复；第二，原生安全设计，针对多租户体验场景和单租户私有化部署场景，分别采用临时凭证隔离和VPC内部署等不同安全机制；第三，运行时安全防护，通过“大模型防火墙”和“AgentArmor”等工具，实时检测并拦截恶意输入和非预期行为，保障模型和智能体在运行过程中的安全。

信息安全知识库 vipread.com

2 个月前

Safe Harbor or Hostile Waters: Unveiling the Hidden Perils of the TorchScript Engine in PyTorch (PRE-RECORDED)

本文链接 PyTorch 是一个基于 Torch 库的机器学习库，广泛应用于计算机视觉和自然语言处理等领域。它是最受欢迎的深度学习框架之一。然而，尽管 PyTorch 拥有强大的功能，但其背后潜藏着潜在的安全风险。最初，PyTorch 使用 pickle 保存模型，但由于 pickle 反序列化的不安全性，加载模型时存在远程代码执行（RCE）的风险。随后，PyTorch 引入了 weights_only 参数来增强安全性。官方文档指出，weights_only=True 被认为是安全的，并建议使用它，而不是 weights_only=False。多年来，weights_only=True 的安全性一直没有受到挑战。然而，我们的研究揭示了一些令人不安的事实。我们发现，使用 weights_only=True 的 torch.load 支持 TorchScript，这促使我们深入研究 TorchScript 的内部工作机制。在一段时间的研究后，我们发现了几个漏洞，并最终实现了远程代码执行（RCE）。我们迅速将这一发现报告给了 PyTorch，PyTorch 确认了该漏洞并为我们分配了 CVE-2025-32434。这个发现颠覆了已有的认知，并对许多 AI 应用产生了深远的影响。我们将在本报告中深入分析该漏洞的影响。在本次简报中，我们将介绍如何获得灵感并发现这一有趣的漏洞。同时，我们的发现再次验证了这句话：“你曾以为的安全港，实际上是敌人的水域。”

信息安全知识库 vipread.com

2 个月前

大模型驱动安全升级：腾讯代码安全应用实践（QCon2504）

本文链接腾讯 TEG 安全平台部代码安全负责人张栋已确认出席，并发表题为《大模型驱动安全升级：腾讯代码安全应用实践》的主题演讲。安全漏洞是每一个企业都必须面对的问题，处理不好动辄影响服务可用性、导致核心业务敏感数据泄露，对业务及公司造成不良影响。基于此在企业研发体系中，绝大多数企业会选择通过安全左移在软件开发生命周期的早期阶段进行风险识别和安全问题修复。但是，传统的静态分析工具本身因其检测方式导致的覆盖有限、高误报、修复效率低等问题，增大了业务团队负担，致使业务对安全问题响应慢、体感差。在本次分享中，张栋将结合腾讯内部的实践经验，深入探讨大模型在代码安全场景中的应用，分享在不同发展阶段其遇到的挑战及其解决方案。演讲提纲 1.代码安全现状及问题分析传统代码安全现状传统代码安全痛点业务安全场景痛点传统代码安全的局限性 2. 大模型在代码安全场景应用与挑战大模型赋能传统工具大模型助力安全左移大模型自动化漏洞检测 3. 技术架构及解决方案行业前沿解析架构设计及能力演进基础能力建设 4. 总结及展望工程实践心得大模型在代码安全场景落地的方向演讲亮点代码安全场景大模型落地思路及过程经验分享大模型自动化漏洞扫描思路及过程经验分享专用领域大模型的微调思路及过程经验分享听众收益了解专用模型领域微调思路及落地实践了解大模型落地过程中常见问题及解决方案了解大模型赋能安全的基础上，进一步泛化至其他应用场景

信息安全知识库 vipread.com

2 个月前

让安全大模型不做花瓶

本文链接本议题聚焦于面向复杂场景的模型训练与架构设计，提出多种解决方案提升模型在网络安全场景下的理解与推理能力。在此方案下的实验中，体现了自动渗透、自动修复、自动信息收集、自动打靶、参与CTF竞赛等通用能力，初步具备无需人工干预的通用执行能力。《让安全大模型不做花瓶》提出以RAG+ToT（Tree-of-Thoughts）架构破解大模型在安全场景中的上下文瓶颈，通过“分解-探索-剪枝”三阶段推理，把复杂网安任务拆成可验证的子链，再按优先级回溯生成最优策略。我们使用230M网安图书、1.1B公开文章及CTF Write-up继续预训练Hive-0模型，并引入GRPO强化学习与人类红队对抗，实现漏洞挖掘、渗透测试、告警研判等场景的自动化决策。配套浏览器驱动、Console工具链，支持一键调用扫描器、取证脚本，形成“人机协同-无人对抗”的闭环，真正让安全大模型从“问答玩具”变成可落地的防御生产力。

信息安全知识库 vipread.com

2 个月前

如何训练AI帮我调漏洞

本文链接本议题将探讨如何结合大模型与MCP技术，实现对程序的静态分析、动态调试。基于这些技术，可以让AI参与漏洞研究，提升漏洞挖掘效率，并配合实际案例，展示AI在漏洞方面的工作能力。《如何训练AI帮我调漏洞》以实战视角拆解大模型在漏洞挖掘与复现中的落地路径：先通过Function Calling打通LLM与IDA、GDB等工具的“最后一公里”，再借助MCP协议把静态反编译、动态调试、PoC生成、流量监控等异构能力串成一条Agent工作流。W22现场演示用AI编辑器+ida-mcp-server秒读ELF、定位strcpy溢出；用gdb-mcp-server远程下断、单步追踪内存变化；最终自动化复现Zimbra未授权RCE与未公开网络设备栈溢出漏洞。文档给出完整配置、脚本与踩坑提示，让AI真正“动”起来.

信息安全知识库 vipread.com

2 个月前

容器安全小佑科技云原生安全防护平台产品介绍

本文链接 01 公司介绍 02 云原生安全挑战 03 产品功能与解决方案

信息安全知识库 vipread.com

2 个月前

科技风险合规管理平台介绍

本文链接宇信智臻以AI+大数据驱动的科技风险合规管理平台，覆盖风险识别、评估、整改、监测全生命周期，实现监管规则自动解析、合规动态预警、多源异构数据实时关联分析，通过可视化驾驶舱和智能决策引擎，帮助银行、保险等金融机构降本增效、精准防控、轻松迎检，已服务多家国有及股份制银行落地标杆案例。

信息安全知识库 vipread.com

2 个月前

应急响应_勒索病毒应急响应手册

本文链接安恒信息《勒索病毒应急与响应手册》系统梳理勒索病毒传播、加密、勒索全过程，提供“判断-应急-恢复-加固”四步闭环方案：先通过系统日志、文件后缀、壁纸变化快速确认是否感染；再按中毒阶段给出隔离、取证、溯源、日志分析等基础与高级应急措施；对已被加密主机提供备份还原、解密工具、数据恢复、支付决策、重装加固五种处置策略；最后从安全意识、补丁漏洞、端口管理、EDR终端检测、APT边界防御、安全培训、灾备演练等维度建立长期防治体系。手册内含真实勒索提示截图、操作截图、流程图及配套渗透测试、应急演练、保险理赔指引，帮助企事业单位最小化业务中断与经济损失。

信息安全知识库 vipread.com

2 个月前

永安在线金融行业案例

本文链接银行反洗钱方案案例银行黄牛攻防系统搭建方案案例银行反营销欺诈解决方案保险业务安全建设方案案例保险营销反欺诈方案案例保险营销发欺诈方案案例证券反欺诈解决方案案例证券数据资产泄露解决方案

信息安全知识库 vipread.com

2 个月前

ISO IEC 42001:2023 人工智能管理体系 Information technology -- Artificial intelligence Management system

本文链接人工智能（AI）正日益应用于所有利用信息技术的行业，并预计将成为主要的经济驱动力之一。这一趋势的一个结果是，某些应用在未来几年可能会引发社会挑战。本文旨在帮助组织在涉及AI系统（例如使用、开发、监控或提供利用AI的产品或服务）时，负责任地履行其职责。AI可能引发以下特定的考虑因素，例如：以自动决策为目的的AI使用，有时以非透明和不可解释的方式进行，这可能需要超出传统IT系统管理的特定管理。使用数据分析、洞察和机器学习，而非人类编码的逻辑来设计系统，既增加了AI系统的应用机会，也改变了这些系统的开发、论证和部署方式。能够进行持续学习的AI系统在使用过程中会改变其行为。这些系统需要特别考虑，以确保在行为变化的情况下其负责任的使用能够持续下去。本文件提供了在组织背景下建立、实施、维护和持续改进AI管理系统的要求。预计组织将把这些要求的应用重点放在AI独有的特征上。AI的某些特征，如持续学习和改进的能力，或缺乏透明性和可解释性，如果它们引发的担忧超出传统执行任务的范围，可能需要不同的保障措施。采用AI管理系统来扩展现有的管理结构是组织的一项战略决策。

信息安全知识库 vipread.com

2 个月前

WDTA AI STR 04 - AI智能体运行安全测试标准

本文链接 AI agents increasingly drive critical systems—from healthcare diagnostics to autonomous vehicles. Yet their autonomy introduces vulnerabilities: adversarial attacks, data leakage, and unintended harmful behaviors. This standard provides a systematic methodology to test agent resilience across interfaces, models, tools, and life-cycle stages, ensuring they operate within ethical and safety boundaries. Aligned with WDTA’s 3S principles (Speed, Safety, Sharing), this document accelerates secure AI adoption while fostering international collaboration. We commend the AI STR Working Group and contributors for pioneering a framework that balances innovation with accountability. Their expertise delivers actionable guidance for developers, auditors, and policymakers to build AI systems that serve humanity securely.

信息安全知识库 vipread.com

2 个月前

加密流量检测专场：技术精讲+实战案例分享

本文链接一、以TLS协议为代表的业务加密通信流量检测二、以Webshell、木马回连、隧道通信的安全工具相关的攻击加密流量检测

信息安全知识库 vipread.com

2 个月前

百度基于大模型安全运营的质效提升实践

本文链接百度作为一家业务复杂的大型互联网企业，同时又是关键基础设施，随着网络安全威胁的日益加剧，传统的安全运营手段在效率和效果上都面临巨大挑战。本次分享将介绍百度如何基于大模型构建深度安全推理智能体框架，实现运营效率和效果的双重提升，并展示包括告警自动研判和漏洞事件分析在内的实践经验，希望能给听众带来一些大模型安全领域应用最佳实践的启示。演讲提纲背景和挑战大模型开始逐步应用于安全运营场景百度安全运营面临的双效（效率+效果）提升需求 2. 架构设计设计目标：基于深度安全推理智能体框架，实现双效提升设计考虑：人机协同的工作流设计（运营流程梳理、质量标准定义、人机交互模式）、模型能力边界与拓展（模型结果可信度和可解释性、知识和工具依赖）、实施成本整体架构（自底向上）：底座模型的知识补充 RAG、CoT、Function calling 流程编排智能体 Review 机制 3. 实践案例告警自动/辅助研判 + 事件处置漏洞事件自动分析 + 处置 4. 未来展望大模型原生的安全运营中心实践痛点明确目标，围绕安全运营场景的风险偏好，制定更贴合实际的落地目标，避免直接盲目追求大而全的零职守无人干预以数据驱动能力迭代，缺少可用数据时应当从实际场景中提升标准化和自动化水平，引入业务的数据活水，避免直接使用脱离业务的合成数据演讲亮点从架构设计层面剖析安全运营场景双效提升应遵循的必要准则，提供构建深度安全推理智能体框架的完整视角细粒度展现告警研判、漏洞分析处置等实际场景的双效提升最佳实践听众收益了解互联网大厂的安全运营需求痛点与大模型实践经验了解规模化且对效果要求较高的安全运营场景下，大模型智能体设计考虑与整体架构

信息安全知识库 vipread.com

2 个月前

全球视野下的合规之道：携程海外数据安全管理实践

本文链接出海成为众多国内企业实现业绩新增长曲线的选择，然而随着数据的重要性提升，法律及监管关注度也在增强，携程作为在线旅行行业较早布局海外业务的企业，在海外数据安全合规风险上也有所积累。本次演讲将分享携程海外数据安全合规风险管理的思路和经验，希望能给相关出海企业企业带来一些合规实践上的启示。演讲提纲出海面临的数据安全合规挑战法律法规近些年主要变化及监管挑战从数据视角深度剖析出海合规风险 2. 携程应对策略及实践携程的海外合规整体策略设计如何通过GRC平台形成风险管理闭环如何保障旗下Trip.com产品的隐私合规 3. 海外数据安全合规未来展望和应对思考实践痛点合规风险管理线上化需要建立在标准化的风险管理、优秀的产品设计、合理的内部运营流程等基础上，才能实现控制域的完备性、控制方法的准确性、关键控制的有效性、审计覆盖的充分性等关键指标。演讲亮点结合合规实战介绍部分法域的合规挑战介绍携程自研GRC(Governance, Risk and Compliance )平台如何融合监管情报、外规内化、审计整改等多个治理环节，解决出海过程中面临多法域、多品牌的风险管理挑战听众收益帮助了解现有海外数据安全相关合规的整体风险态势帮助了解标准化及线上化在多法域数据安全合规风险管理中的价值

信息安全知识库 vipread.com

2 个月前

大模型和多智能体系统安全风险分析和洞察

本文链接随着⼈⼯智能（AI）技术的⻜速发展，以⼤型语⾔模型（LLMs）为核⼼的智能体（AI Agents）和多智能体系统(Multi-Agents System)正⽇益深⼊到各个应⽤领域，从简单的对话助⼿到复杂的⾃主决策系统。与此同时，作为连接 AI 模型与外部世界（包括⼯具、数据源和其他智能体）的关键桥梁，模型上下⽂协议（MCP）的出现进⼀步拓展了 AI 智能体的能⼒边界。然⽽，这种能⼒和集成度的提升也带来了前所未有的安全挑战。本⽂将针对⽬前披露的针对⼤模型、 MCP 和 AI 智能体的各类安全攻击⽅法，简要分析和总结，深⼊剖析原理、关联性和影响，⼒求提供⼀个当前时点较为全⾯的威胁分析视图，并结合最新的研究进展，为当前的防御策略提供洞察

信息安全知识库 vipread.com

2 个月前

大模型安全风险治理与防护

本文链接大模型企业应用十大常见安全风险 01 样本投毒（数据污染） 02 恶意利用（Prompt注入攻击） 03 代码辅助工具数据泄露（第三方代码辅助工具） 04 第三方代码依赖风险（开源模型/库污染） 05 自动化Agent权限滥用 06 自建模型平台暴露面过大 07 训练数据隐私泄露 08 模型推理劫持（对抗样本攻击） 09 AI伦理与偏见放大 10 开源模型滥用（深度伪造与辅助犯罪）

信息安全知识库 vipread.com

2 个月前

大型语言模型 (LLM) 安全风险、案例与防御策略

本文链接这是 ChaMD5 安全团队 AI 组的第一篇关于大语言模型（LLM）的安全研究报告，尽管团队在 AI 安全领域已经有了一定的积累，但由于是初次撰写报告，我们深知在专业性与严谨性方面可能存在着诸多不足。真诚地希望各位读者老师能够不吝赐教，对报告中的任何问题提出宝贵的意见与建议，帮助我们不断改进与提升。引言 LLM 安全格局：机遇与风险并存剖析核心风险：OWASP LLM Top 10 (2025 版) 详解真实世界的威胁：LLM 与供应链安全案例研究 4.1. 案例研究：数据投毒 - PoisonGPT 实验 4.2. 案例研究：软件供应链攻击 - PyTorch 'torchtriton' 事件 4.3. 启示与影响安全构建：LLM 开发与防御框架及工具 5.1. 开发编排框架：LangChain 5.2. 防御工具：Rebuff AI 5.3. 防御工具：Garak 5.4. 其他相关工具 5.5. LLM 安全工具比较建议与未来展望附录 7.1. 关键术语解释 (Glossary of Key Terms) 7.2. OWASP Top 10 for LLM Applications (2025 版) 完整列表 7.3 参考引用

信息安全知识库 vipread.com

2 个月前

安全大模型的最后一公里实践：智能决策与自动响应

本文链接雾帜智能联合创始人兼CTO傅奎在QCon全球软件开发大会分享了安全大模型在网络安全领域的应用。在网络安全面临挑战的背景下，大模型应用虽受关注但实际场景较少，多数公司难以自研安全大模型。国外有微软Security Copilot等产品，国内大模型在安全运营领域有安全事件“翻译”、结构化输出、战报日报总结、漏洞挖掘增强等应用场景，但存在重分析、轻决策、零执行的问题。在智能决策领域，正探索让大模型实现主动思考、智能决策和自动执行，如应对暴力破解攻击时给出合理建议。在实践案例中，基于BAS验证结果的智能响应场景，虽面临BAS系统输出解析和优化建议可操作性等关键难点，但通过合理设计技术实现思路，如通用字段提取、智能决策引擎等，可实现风险漏洞闭环。未来，可通过提升模型能力、优化提示词、进行模型微调、丰富上下文等提高模型决策质量，借助SOAR安全剧本及应用APP电子市场等实现能力调度，还可通过标准化输入输出、构建AI虚拟SOC团队等提高准确性和采纳率，向零值守无人安全运营中心迈进，但仍需重视人的因素。

信息安全知识库 vipread.com

7 个月前

钓鱼邮件导论

本文链接钓鱼邮件种类钓鱼邮件写法如何成功制作一封钓鱼邮件

信息安全知识库 vipread.com

2 年前

网络安全行业简史与网络攻端人才的未来

本文链接第一部分网络安全与中国黑客成长简史第二部分攻防两端对抗技术演进简史第三部分网络攻端人才的未来

信息安全知识库 vipread.com

2 年前

人工智能与网络空间安全

本文链接 AI在网络安全的应用 AI模型安全与隐私针对AI赋能安全的攻击 AI时代网络空间安全新挑战

信息安全知识库 vipread.com

2 年前

AD域渗透之跨域攻击

本文链接个人介绍前置知识域与域之间的横向移动绕过SID过滤

信息安全知识库 vipread.com

2 年前

链上洗钱与反洗钱

本文链接链上洗钱与反洗钱重要性：利用加密货币进行洗钱的增长趋势明显，反洗钱是阻止黑客获取收益，追回损失的最后一道防线。

信息安全知识库 vipread.com

2 年前

Hacking Spring

本文链接 Audit Spring Framework & Spring Boot Hacked Spring

信息安全知识库 vipread.com

2 年前

弯道超车：几乎没有防护的iOS逆向体验

本文链接安卓应用的防护手段 iOS应用的防护手段同应用防护力度对比 r0cap/r0tracer支持iOS！

信息安全知识库 vipread.com

2 年前

Exchange核心攻防

本文链接个人介绍 Exchange架构 CVE-2020-0688 ProxyLogon ProxyShell 总结

信息安全知识库 vipread.com

2 年前

电诈客服系统实战分享

本文链接电诈团伙产业链条演变裸聊诈骗的套路解密裸聊诈骗的幕后技术深入电诈团伙内网探测对团伙内网管理软件的突破

信息安全知识库 vipread.com

2 年前

运营商光猫攻击面分析

本文链接不同运营商使用相同固件会存在同一类型漏洞供应链中引入的代码可能永远不会得到审查介绍安全漏洞研究&漏洞总结

信息安全知识库 vipread.com

2 年前

Rss源地址

https://vipread.com/feed

更新频率

1条记录，更新于10月 10 11:00 晚上

每日