首页 > 行业重磅！首个生成式AI安全指导性文件正式发布！

重磅！首个生成式AI安全指导性文件正式发布！

2024年03月14日 17:09

3月1日，全国网络安全标准化技术委员会（TC260）发布了《生成式人工智能服务安全基本要求》（TC260-003），旨在确立生成式人工智能服务的安全标准。这些要求涵盖语料安全、模型安全、安全措施，并详细说明了安全评估的流程。文件的目标是指导服务提供者进行安全评估，提升安全管理水平，并为主管部门提供评估服务安全水平的参考。要点概览如下：

一、语料安全要求：服务提供者在采集和使用语料时，必须确保来源的安全性和合法性，并在采集前后进行安全评估，限制违法信息的比例不超过5%。语料来源应多样化且可追溯，包括开源语料、自采语料、商业语料及用户输入信息的合法授权。服务提供者还需通过技术手段和人工抽检确保语料内容的合规性，妥善管理知识产权，并在处理个人信息时遵守法律规定。此外，标注人员应接受安全培训，以确保标注内容的准确性和安全性。

二、模型安全要求：服务提供者使用第三方基础模型时，必须确保模型已获得主管部门备案。在模型训练过程中，内容安全性应作为主要评价指标，同时建立监测机制，及时处理安全问题，并通过技术手段优化模型。此外，应提高模型对用户输入意图的响应能力，确保内容的科学性和准确性，以及内容格式的合理性和有效性。

三、安全措施要求：服务提供者应确保其服务在适用性、安全性、透明度等方面符合规定要求。这包括确保服务适用于正确的人群和场合，提供必要的保护措施，公开服务信息，提供关闭个人信息用于训练的选项，满足国家规定和标准要求，评估供应链安全，提供多种投诉举报途径，防止违法信息的生成，设置监看人员，制定模型更新升级的安全管理策略，隔离训练和推理环境，防范恶意攻击，定期进行安全审计，以及建立备份和恢复策略。

四、其他要求：为确保网络安全和内容合规性，应建立全面且代表性的关键词库和测试题库，并定期更新。关键词库应覆盖各种安全风险，而测试题库应用于内容过滤和安全评估。

五、安全评估要求：评估可以自行进行或委托给第三方，应包含所有相关条款的评估结果。评估报告需包含证明材料，并由三名负责人签字。语料和生成内容的安全评估应通过抽检确保合格率达标，而问题拒答评估则确保模型正确拒答不当内容。

总结：文件的发布为生成式人工智能服务提供了一套全面的安全指南，涉及语料收集、模型使用、安全措施和评估流程，以确保服务的安全性和合规性，促进服务提供者提升安全水平，保护用户权益，并支持可持续发展。

责任编辑：

文章来源：//www.profoottalk.com/2024/0314/10969.shtml