等保三级认证——我们是怎么通过的

宝软数字 · 产品深度解读 · 2025-09-05

"等保三级"是很多技术团队听到就头疼的词。它不只是技术问题——还涉及管理制度、人员配置、物理安全、应急响应等一整套管理体系。很多人以为等保就是"买设备、做配置、拿证书"，但实际上等保的精髓是让你的安全能力被系统地管理和持续改进。EIOS在2026年完成了等保三级（S3A3G3）的认证。本文不是等保标准解读（网上有很多），而是完整记录我们的实战过程：从定级备案开始，到差距分析、整改建设、测评准备、现场审查，每一个阶段的真实工作量、技术方案、制度和踩坑。

定级与备案——第一步就走对了方向

等保的第一步是定级——确定你的信息系统属于哪个安全保护等级。这个决定影响后续所有工作的范围和成本，所以必须在开始时就判断准确。EIOS被定为第三级（S3A3G3），依据是GB/T 22240-2020的定级指南。

定级的逻辑是对系统遭受破坏后造成的影响进行评估。三级的标准是：系统遭受破坏后，可能对社会秩序和公共利益造成严重损害，或者对国家安全造成损害。EIOS作为企业AI平台，处理大量企业的核心业务数据和AI决策过程。如果平台被攻破，攻击者可能获取多家企业的商业机密数据、操纵AI决策输出、通过Agent工具链访问企业内部系统——这些后果确实属于"对社会秩序和公共利益造成严重损害"的范畴。

定级过程中有一个值得分享的经验：不要低估自己的等级。有些团队倾向于"定低一点，测评容易过"——这是危险的误导。首先，等保定级有法律效力，故意低定可能涉及违规。其次，定级影响客户信心——企业客户（尤其是金融、政府行业的客户）会关注你的等保等级，三级是一个明确的信任信号。最后，从安全工程的角度，定级决定了你要投入多少资源——如果你实际需要三级保护但定了二级，等于给自己留了一个安全负债。

定级完成后是备案——向所在地公安机关提交定级报告和备案材料。这个过程主要是行政性的，但需要准备的文档不少：信息系统基本情况表、定级报告、网络拓扑图、安全责任人和联系方式、专家评审意见（三级需要至少3名专家评审通过）等。我们的备案材料准备花了约2周时间，主要时间消耗在等待专家评审安排。一个小技巧是提前联系测评机构——他们通常有合作的专家资源，可以帮你协调评审时间。

关键提醒：等保不是"建设完了再请测评机构来打分"——测评机构会参与从定级到整改的全过程。建议在定级阶段就选定测评机构，让他们提前了解系统架构和业务特点。我们选择的测评机构在定级阶段就给出了一些重要的建议——比如"你们的公有云架构需要特别关注云服务商与客户的安全责任边界"——这些建议在后续的整改中省了不少弯路。

差距分析——发现你不知道不知道的

测评机构进场后的第一件事是差距分析——对照等保三级的要求清单，逐条评估当前系统的满足程度，找出差距。这一步通常会让人清醒——你会发现很多"我以为我们已经做了"但实际上做得不够的地方。

等保三级的要求分布在五个层面：物理安全、网络安全、主机安全、应用安全、数据安全与备份恢复。此外还有安全管理层面：安全管理制度、安全管理机构、人员安全管理、系统建设管理、系统运维管理。总共约300条具体要求。我们的差距分析结果是：完全满足约55%，部分满足约30%，不满足约15%。不满足的项目主要集中在安全管理层面——纯技术出身的团队容易忽略制度和流程建设，这也是最常见的问题。

具体来说，几个典型的差距包括：第一，安全管理制度不完整——我们有很多"实践"但没有落到纸面上。比如密码策略、访问控制策略、变更管理流程，工程师们在执行但没有正式文档。等保要求这些必须有书面制度，而且要有版本控制和审批记录。第二，审计日志不全面——我们有API访问日志和数据库操作日志，但缺少网络安全设备的日志、主机层面的登录日志、以及应用层面的用户操作日志。等保要求覆盖所有层面的审计。第三，应急预案没有经过演练——我们有书面预案，但没有定期演练记录。等保要求每年至少一次应急演练且有演练报告。

心态调整：差距分析阶段很容易产生抵触情绪——"这些都是形式主义，我们实际安全性不差"。这种心态需要调整。等保的制度建设确实有行政色彩，但它解决了一个真实问题：安全不仅依赖技术防护，还依赖人的行为规范。没有书面制度的安全实践是不可持续的——当关键人员离职时，隐性知识可能随之流失。差距分析的产出是一份详细的整改清单，包括每个差距项的描述、影响、建议整改措施、预计工作量。这份清单是后续整改建设的施工图纸。

技术整改——安全能力的工程落地

差距分析之后是整改建设——这是整个等保过程中最耗时、最吃工程能力的阶段。我们的整改历时约3个月，涉及技术、管理和人员三个方面。先说技术整改。

技术层面的整改覆盖了几个关键系统。一是安全审计系统的完善——我们搭建了统一的日志收集和分析平台，基于ELK Stack（Elasticsearch + Logstash + Kibana），再辅以Filebeat收集各层面的日志。日志源覆盖了：网络设备（防火墙日志、交换机日志）、操作系统（登录日志、sudo操作日志）、应用系统（API访问日志、业务操作日志、Agent推理日志）、数据库（查询日志、慢查询日志、DDL变更日志）、安全设备（WAF日志、IDS/IPS日志）。所有日志统一打上traceId，实现全链路关联。日志保留6个月以上，关键安全日志保留3年。另一个重要的整改是入侵检测系统——部署了基于Suricata的NIDS（网络入侵检测）和基于OSSEC的HIDS（主机入侵检测）。NIDS监控网络流量中的攻击特征，HIDS监控主机层面的文件完整性变更、异常进程、异常登录等。两个系统的告警汇总到同一个安全运营平台。

二是漏洞管理流程的建立。我们使用Trivy做容器镜像的漏洞扫描（集成到CI/CD流水线，阻断HIGH和CRITICAL级别漏洞的构建），使用Nessus做主机层面的漏洞扫描（每周自动扫描，生成报告），使用OWASP ZAP做应用层的动态扫描（每次上线前执行）。发现漏洞后按照CVSS评分分级响应——Critical漏洞必须在24小时内修复，High漏洞在72小时内，Medium漏洞在下一版本中修复。所有漏洞有追踪记录，包括发现时间、修复时间、修复方案、验证确认。

三是数据备份与恢复的验证。等保要求证明数据的备份是有效的——不能只是"我们在做备份"，还要"我们能恢复"。我们的方案是：数据库每日全量备份+实时binlog增量备份，备份文件异地存储（与生产环境不在同一物理区域），每周执行一次恢复演练——从备份文件中还原一个测试数据库，验证数据的完整性和可用性。恢复时间目标（RTO）为4小时，恢复点目标（RPO）为15分钟。

意外的收获：整改过程中的一个意外发现是，为了满足等保要求搭建的统一审计平台，后来成了业务数据分析的重要基础设施。因为所有操作都被记录了，我们可以分析用户使用产品的方式、Agent的性能瓶颈、频繁出现的错误模式——这些数据对产品迭代极有价值。这是"安全投入不仅降低风险，也创造业务价值"的一个具体例子。

制度建设——从实践到文档，从文档到文化

制度建设的本质不是写文档——是把安全实践标准化、可执行化、可持续化。等保三级要求建立一整套安全管理制度体系，涵盖：安全方针与总体策略、安全管理机构与岗位职责、人员安全管理制度、系统建设管理制度、系统运维管理制度、安全事件应急预案、安全评估与审计制度等。

我们编写了约40份制度文档，总计超过12万字。最大的教训是：不要写没人会执行的制度。制度文件必须和实际操作一致——如果制度说"数据库密码每90天轮换一次"，那就要真的建立自动轮换机制，并且有轮换记录。如果制度做不到，就不要写进去——测评机构会逐条验证制度的落地情况。我们的做法是：先梳理现有的安全实践，把它们书面化（而不是凭空设计一套制度）；然后对照等保要求，补齐缺失的部分；最后把制度文件交给实际执行这些操作的人审阅确认——他们如果说"这条我做不到"或"这条和我实际做的不同"，就修改制度使其与实际一致。

制度中值得特别提及的是安全事件应急预案。等保要求不仅要有预案，还要有演练记录。我们设计了四类应急场景的演练：DDoS攻击应急响应（模拟大流量攻击触发清洗流程）、数据泄露应急响应（模拟数据库被非法访问后的溯源和通知流程）、勒索软件应急响应（模拟生产环境被加密后的恢复流程）、AI模型安全事件应急响应（模拟Agent被提示注入后执行危险操作的处理流程）。每季度进行一次桌面推演，每年至少一次实战演练（在独立环境中模拟真实攻击）。演练后产出演练报告，记录发现的问题和改进措施。这些演练不仅在等保测评中提供了重要的符合性证据，也实实在在地提高了团队的安全响应能力。

制度落地的关键：安全管理制度最常犯的错误是"写完之后束之高阁"。我们发现，要让制度真正落地，需要三个要素：一是制度的责任人——每个制度文件明确指定owner，由owner负责制度的更新和执行监督；二是制度执行的自动化——能用技术手段自动检查的就不靠人工，比如密码策略通过IAM系统自动实施，备份策略通过定时任务自动执行；三是制度执行的可见性——通过仪表盘或定期报告展示各项制度的执行情况，让管理层和技术团队都能看到安全管理的真实运转。

现场测评——检验真功夫的时刻

现场测评通常持续2-3天，测评团队由3-5人组成，包括技术测评员和管理测评员。他们会带着差距分析时的整改清单，逐条检查整改情况，同时对整个系统进行全面的安全检测。

技术测评包括几个关键动作。一是漏洞扫描——测评机构使用自己的扫描工具（通常是nessus或绿盟的RSAS）对系统进行全面扫描，检查是否存在已知高危漏洞。扫描范围包括所有对外暴露的IP、端口和Web应用。如果发现HIGH或CRITICAL级别的漏洞，对应的测评项直接不合格。我们的经验是：在正式测评前至少做一次自扫——使用相同的工具、相同的扫描策略、相同的目标范围，确保不会出现"不知道的漏洞"。

二是渗透测试——测评员会尝试一些基本的渗透测试，包括SQL注入、XSS、弱口令爆破、未授权访问等。他们没有时间做深度渗透（这不是等保测评的重点），但会覆盖OWASP Top 10中的常见漏洞类型。如果渗透测试成功（比如找到了一个SQL注入并成功读取了数据库），相关测评项直接不合格。

三是配置核查——检查安全设备的配置是否符合要求。比如防火墙规则是否是最小权限、WAF规则集是否最新、数据库是否启用了审计日志、服务器是否关闭了不必要的端口和服务。配置核查的特点是"细节多"——很多配置项是二进制判断（有或没有），所以要确保每一个细节都到位。

管理测评主要通过与相关人员面谈和检查文档记录来进行。测评员会随机抽取几名员工，询问安全管理制度的执行情况——比如"你负责的系统的备份策略是什么？最近一次恢复演练是什么时候？结果如何？"这些问题不是背答案就能过的——测评员会看你的回答是否和文档记录一致。

现场测评的关键准备：一是所有制度文档、记录表格、演练报告、审计日志必须提前整理好，测评员要什么能立刻拿出来。建议按照等保测评指标逐条整理证据材料——每一条指标对应一个文件夹，里面是该条要求的所有证明材料。二是关键岗位人员必须到位并熟悉相关制度和操作——至少包括系统管理员、网络管理员、安全管理员、数据库管理员。三是测评现场需要一个"中转人"——通常是项目经理或安全负责人，负责对接测评员的需求、协调内部资源、记录测评员的反馈。这个人要非常熟悉整个系统和技术细节，能够在测评员提出问题时给出准确的解释。

测评之后——合规不是终点

现场测评结束后，测评机构会出具测评报告。报告中每一条测评指标的结论分为：符合、部分符合、不符合、不适用。如果结论是"不符合"或"部分符合"，报告中会给出具体的问题描述和整改建议。你需要在规定时间内完成整改，测评机构会进行复核。全部整改完成后，测评机构出具最终的测评报告——这是等保的核心交付物。

拿到测评报告不代表结束了。等保不是一次性认证，而是持续性的合规义务。三级系统每年至少需要进行一次安全自查，每两年需要进行一次等保测评复评。更重要的是，等保要求的安全管理活动是日常性的——安全审计日志要持续收集分析，漏洞扫描要定期执行，备份恢复要定期验证，应急演练要按期进行，制度文件要随业务变化而更新。如果复评时发现这些日常活动没有执行，一样会不合格。

我们的体会是：等保的最大价值不在于拿到证书，而在于推动团队建立了系统化的安全管理能力。在等保之前，我们的安全实践是碎片化的——有加密、有WAF、有审计，但没有形成体系。等保的过程迫使我们把安全管理的各个方面（技术、制度、流程、人员）打通，建立了从"发现风险"到"整改问题"到"验证效果"的完整闭环。这个闭环不仅满足合规要求，更重要的是让安全管理成为可度量、可改进的日常工作，而非"应急式的救火"。

给准备过等保的团队几点建议：一、提前3-6个月开始准备，不要等到"需要证书了再赶"，整改需要时间沉淀。二、选择有经验的测评机构——好的测评机构会在定级和差距分析阶段给出有价值的技术建议，帮助减少无用功。三、安全管理和技术整改同步推进——很多团队专注于技术而忽略了制度，导致现场测评时管理层面大量不符合。四、把等保视为"安全能力的基线"而非"天花板"——等保告诉你必须做到什么，但你应该做得更好。安全是持续改进的过程，不是一次性的工程。

需要等保合规的企业AI平台方案？

预约技术交流，获取完整合规路线图

🔍 预约交流