联合实验室林佳涛：智能体数据风险应转向全生命周期主动治理

3月24日，以“APEC中国年贡献粤智慧”为主题，AI数据隐私保护交流会暨广东省网络数据安全与个人信息保护协会揭牌活动在广州举行。粤港澳大湾区生成式人工智能联合实验室专家林佳涛作“生成式人工智能数据安全的挑战与应对”主题分享。

林佳涛在分享中指出，随着生成式人工智能从“聊天助手”向“执行助手”加速演进，智能体已具备自主规划与执行能力，其数据安全风险贯穿采集、标注、训练、生成、销毁全生命周期，必须从“被动防御”转向“全生命周期主动治理”。他结合联合实验室的实践，阐释了当前智能体发展面临的数据安全挑战与应对路径。

粤港澳大湾区生成式人工智能联合实验室专家林佳涛作主题演讲。

全生命周期视角下的数据安全风险与典型威胁

林佳涛首先梳理了生成式人工智能全生命周期各环节的风险点。在数据采集阶段，存在非法手段获取数据、超范围收集信息、数据投毒与侵权、训练数据内容不当等问题。在数据标注阶段，标注规则不清晰、人员培训不足、监督缺失可能导致标注环节成为污染源；在训练与优化阶段，数据偏见、算法黑箱、敏感信息泄露风险尤为突出；在内容生成阶段，生成有害或误导信息、隐私泄露与滥用、知识产权归属争议等问题直接影响用户权益与社会秩序；在数据销毁阶段，销毁不彻底可恢复、缺乏统一监管标准和有效监督机制，使得数据生命周期末端同样存在隐患。

他指出，当前生成式AI面临三大典型数据安全威胁：首先是数据投毒与模型污染。攻击者通过注入恶意数据污染模型，使其输出错误或偏见信息。以“毒泉”攻击技术验证为例，最多10%的投毒比例，就足以影响代码生成模型的行为，使其输出有编码错误的代码，严重破坏模型的可靠性与安全性。

其次是隐私泄露与记忆效应。模型可能“记住”训练数据中的敏感信息，并在生成时意外泄露。林佳涛举例道，2023年三星引入ChatGPT后，员工将企业机密信息以提问方式输入，导致半导体设备测量资料、源代码、产品良率等数据进入学习数据库，外泄至境外服务系统且无法收回，企业随后全面禁用ChatGPT。这一事件表明，隐私泄露已从个人层面延伸至企业核心机密。

最后是提示注入攻击。林佳涛指出，攻击者构造诱导性提示，让模型忽略安全规则执行未授权操作。其攻击流程通常为：攻击者注入恶意指令，构造嵌套提示伪装成正常对话，模型执行指令时忽略安全规则，解析并执行恶意代码，最终造成数据泄露、权限提升或执行破坏性操作。这种攻击方式隐蔽性强、危害大，对智能体的安全防护提出了更高要求。

林佳涛强调，面对这些风险，数据安全防护必须从“被动防御”转向“全生命周期主动治理”，构建覆盖数据全链条的防护体系。

数据跨境流动的核心场景与复合风险

粤港澳大湾区具有“一国两制三法域”的特殊背景，数据跨境流动既是区域优势，也是安全治理的难点。林佳涛结合联合实验室的观察，分析了当前数据跨境流动的四大核心场景：

一是跨境调用算力。国内企业因成本或算力需求，主动将数据传输至境外服务器进行模型训练或生成任务。二是调用境外GAI服务。使用境外API接口或云服务平台，数据需出境处理，内容审核等环节同样涉及跨境传输。三是使用境外开源模型。利用GitHub等平台代码构建生成式AI应用，可能因自动回传或日志机制导致数据外流。四是跨境外包服务。将数据清洗、标注等环节外包，涉及大量敏感信息跨境传输。

林佳涛指出，基于此，数据跨境流动带来了三重安全风险：在个人信息安全与隐私风险方面，数据出境导致用户隐私泄露风险增加，监管真空使得个人信息难以得到有效保护。在GAI产业安全风险方面，技术上链路延长增加了攻击面，合规上面临“数据碎片化”与监管冲突，商业上可能导致核心机密泄露。在国家安全与数字主权风险方面，训练数据可能带有价值观偏差，虚假信息跨境传播，敏感数据流动直接威胁数字主权。

他特别提到，我国已构建起较为完备的数据跨境流动政策法规体系，为数据跨境合规提供了制度保障。但在生成式人工智能快速发展的背景下，仍需进一步细化落地路径。

联合实验室的湾区实践：构建“源头管住、过程看住、应用稳住”的治理体系

林佳涛介绍，粤港澳大湾区生成式人工智能安全发展联合实验室由广东省委网信办、国家互联网应急中心广东分中心联合牵头，以“政产学研用”深度融合为路径，以粤港澳大湾区企业为主体，联合相关高校、科研机构、媒体等组建合作共同体，旨在构建共建、共治、共享的人工智能创新治理生态。

联合实验室的建设得到了广东省委的高度认可，被列为省落实党的二十届三中全会精神的重要事项。自2025年9月正式揭牌以来，为构建“动态敏捷、多元协同”的创新治理联合体不断努力。

在具体实践上，联合实验室围绕三大方向构建治理体系。一是“源头管住”，即生成式人工智能源头数据安全与合规治理。根据国家网信办等7部门发布的《生成式人工智能服务管理暂行办法》要求，联合实验室开展生成式人工智能服务数据安全与合规评估，建成生成式人工智能安全测评系统，拥有百万级测评问题集，可实现即时对话测试、批量化自动化评测、生成内容安全风险辅助判别与审核管理、大模型安全态势感知等功能。截至目前，已累计服务全省大模型备案登记130余款。

二是“过程看住”，重视AI标识管控下的数据传播安全。 2025年9月1日施行的《人工智能生成合成内容标识办法》为保障AI数据传播安全提供了制度保障。联合实验室通过自动化AI标识评估系统，确保数据生成与传播可追溯、内容真伪可验证，防止虚假信息扩散，同时防止AI数据大规模污染互联网，保障模型训练迭代质量。联合实验室已上报多款省内外未进行AI标识、AI标识不规范的应用。

三是“应用稳住”，即执行型智能体的全生命周期数据安全。针对智能体正由“聊天助手”向“执行助手”演进、具备自主规划与执行能力的新趋势，联合实验室已针对这一新型风险构建起“风险发现—研判分析—上报处置”的全流程数据安全治理体系，覆盖数据采集、标注、训练、生成、销毁全部环节。

出品：南都大数据研究院

采写：南都N视频记者孔令旖