RAG技术进化——从基础检索到Agentic RAG
如果你问2025年"企业落地AI最常见的技术方案是什么",答案基本只有一个:RAG(Retrieval-Augmented Generation,检索增强生成)。这个技术让企业可以把内部文档、规章制度、产品手册、历史记录"喂"给AI,使AI能够基于企业自己的知识来回答问题。
但如果你在2026年下半年问同样的问题,答案会复杂得多。因为RAG已经不再是那个简单的"先检索再生成"的流水线了。它进化成了一个由多个Agent协作驱动的、具备主动推理能力的知识管理和运用系统。这个进化不是修修补补,而是重新定义了"企业AI如何使用知识"。
一、RAG的三个时代:从Naive到Agentic
要理解2026年的RAG,必须先理解它走过了怎样的进化路径。我们用三个"时代"来划分:
Naive RAG(2023-2024):这是最原始的RAG——把文档切成块,存到向量库,用户提问时做向量相似度搜索,把最相关的几个块拼到Prompt里,让大模型基于这些块生成回答。这个方案能跑,但问题很多:切块切断了上下文(文档的第3段可能在回答第15段的问题时至关重要,但因为被切碎了,向量搜索找不到它)、检索结果是"相关但不精确"的(搜索"产品退货政策"可能给你一堆产品介绍文档)、回答的准确率随文档复杂度急剧下降。
Advanced RAG(2025):在Naive RAG的基础上加了各种优化技巧。检索前:查询重写(把用户的模糊问题改写成更精确的搜索查询)、查询分解(把复杂问题拆解成多个子问题分别检索)、混合检索(向量搜索+关键词搜索+元数据过滤)。检索后:重排序(用更精准的模型对检索结果重新排序)、上下文压缩(去掉检索结果中的冗余信息)。这些优化让RAG的准确率从Naive RAG的60-70%提升到了80-85%。但它仍然是一个"被动"的系统——你问它答,不问不动。
Agentic RAG(2026):这是正在发生的范式转变。Agentic RAG的核心区别在于:Agent主动管理和使用知识,而不是被动地检索和拼接。在Agentic RAG中,一个专门的"知识Agent"不等待用户提问,而是持续地分析企业中新产生的文档、邮件、会议记录,主动提取关键信息、建立知识之间的关联、更新知识图谱、标记过时的信息、发现知识缺口。当用户提问时,它能做的不只是"找相关文档段落",而是基于它对企业知识的整体理解来推理、综合和回答。
Naive RAG vs Agentic RAG — 一个对比
用户提问:"我们今年最大的供应商风险是什么?"
Naive RAG的典型回答:"根据文档,贵公司有12个供应商。供应商A的交货准时率为85%,供应商B的合同将在年底到期……"(罗列检索到的相关数据,但没有分析)
Agentic RAG的典型回答:"综合分析贵公司今年的供应商数据,我认为最大的风险来自供应商C。原因有三:(1)他们承担了你40%的核心原材料供应,如果出问题你很难找到替代。(2)他们过去6个月的交货准时率从95%降到了78%,趋势在恶化。(3)他们的财务状况在最近的信用报告中被下调了。建议启动备选供应商评估,同时在下一次续约中加入更严格的SLA条款。"
二、Agentic RAG的四大核心能力
Agentic RAG不是对传统RAG的技术改进——它是一种全新的知识管理范式。它拥有四个传统RAG完全不具备的核心能力:
能力一:主动知识采集和更新。传统RAG是"你来喂我"——企业需要手动导入文档、定期更新向量索引。Agentic RAG是"我自己吃"——知识Agent连接到企业的邮件系统、文档管理系统、内部Wiki、CRM,持续主动扫描新产生的内容。它不需要人类告诉它"有新文档了",它自己会发现并处理。更重要的是,它会主动识别知识冲突——当新文档中的信息和旧知识矛盾时(比如新的定价政策与旧的不同),它会标记冲突并提请人类确认。
能力二:知识图谱驱动的推理。向量搜索能找到"语义相关"的内容,但找不到"逻辑相关"的内容。如果你问"谁负责华东区的销售?",向量搜索能找到提到"华东区"和"销售"的文档,但如果你问"谁应该在明天的华东区销售会议上做汇报?",向量搜索就很难给出精确答案——因为这需要知道开会的人、负责的人、汇报关系等多重逻辑关系。Agentic RAG在向量库之上构建了知识图谱(Neo4j、ArangoDB等图数据库),把企业知识中的实体(人、部门、产品、客户、合同)和关系(属于、汇报给、负责、签订)显式地建模。这让Agent能够做多跳推理——从一个实体出发,沿着关系链条找到答案。
能力三:多源信息综合与矛盾消解。企业中经常出现这样的情况:三个不同的文档对同一个问题给出了三个不同的答案。传统RAG会随机选择一个(或都给你,让你自己判断)。Agentic RAG会检测到矛盾,分析矛盾的来源(是信息来源不同?还是时间不同?),然后告诉你:"根据A文档(2026年5月),答案是X。但根据B文档(2026年7月),答案是Y。B更新,建议以B为准,但需要确认A是否已正式废止。"
能力四:知识的置信度标注。Agentic RAG不仅告诉你"答案是什么",还告诉你"我对这个答案有多确定"。"这两个数字来自ERP系统的实时数据,置信度很高"。"这个趋势判断基于过去三个季度的数据分析和行业报告,置信度中等"。"这个预测涉及尚未发生的市场变化,置信度较低,仅供参考"。置信度标注是Agent从"信息提供者"进化为"决策支持者"的关键一步——决策者需要知道哪些信息是可靠的,哪些是需要自行判断的。
三、知识图谱+向量搜索:双引擎检索架构
Agentic RAG的底层技术架构,我们称之为双引擎检索。传统RAG只有一个引擎(向量搜索),Agentic RAG有两个引擎互补工作。
向量引擎(语义引擎)负责回答"这段文档在讲什么?"。它把文档编码为高维向量,通过余弦相似度找到语义上最接近查询的内容。向量引擎擅长处理模糊查询("最近有哪些重要的事?"),擅长发现隐性语义关系("降低成本"和"增加利润"在向量空间中很接近)。但它不擅长精确匹配("找合同编号CT-2024-0881"——向量搜索对此毫无优势)和逻辑推理("谁是我的上司的上司?"——这需要遍历汇报关系图)。
图谱引擎(逻辑引擎)负责回答"这些实体之间是什么关系?"。它把企业知识中的实体和关系建模为图数据,通过Cypher或其他图查询语言做精确的逻辑推理。图谱引擎擅长精确查询和关系追溯:"找出所有在2026年Q2签订、由华东区销售团队负责、合同金额超过¥100,000的客户"——这条查询在知识图谱中是5行Cypher就能解决的,纯向量搜索几乎不可能做到。
双引擎的关键设计在于查询路由——当一个用户提问进来,Agent首先要判断:这个问题更适合语义搜索还是逻辑查询?模糊的、概念性的问题走向量引擎。精确的、关系型的问题走图谱引擎。很多问题需要两个引擎协同——先用图谱引擎找到相关实体,再用向量引擎搜索这些实体的上下文信息。
在EIOS中,我们使用Neo4j作为知识图谱引擎,pgvector作为向量引擎,并在中间实现了自动查询路由。从实测数据看,双引擎架构相对于纯向量搜索,在涉及关系推理的问题上的准确率提升了35-50%,用户满意度提升了40%。
四、企业知识管理的范式迁移:从文档驱动到知识驱动
Agentic RAG带来的最大变化,可能不是技术层面的,而是企业管理知识的方式发生了根本性转变。
传统企业知识管理是文档驱动的。知识被"封装"在文档中——Word文件、PDF报告、Excel表格、电子邮件。谁想要找知识,就得找到正确的文档,然后阅读和理解其中的内容。这个模式有三个根本缺陷:(1)知识被文档边界隔离——有关"客户A的合同条款"和"客户A的服务记录"在两个不同的文档中,需要人脑把它们关联起来。(2)知识的时效性被文档的创建日期锁定——三个月前的会议纪要中包含了一个重要承诺,但没有人记得去看。(3)知识的发现完全依赖人的主动搜索——一个隐藏在一份不起眼的内部邮件中的关键市场信息,可能永远不会被需要它的人看到。
Agentic RAG将知识管理从文档驱动转变为知识驱动。在这个新范式中,知识从文档中被提取出来,以可查询、可关联、可更新的形式存在于知识图谱中。一份新的合同,不再只是"文件服务器上的一个PDF"——它的关键条款被自动提取并关联到客户实体和产品实体,它的日期和金额被用来更新相关的统计指标,它的异常条款被自动标记给法务团队。
这个转变听起来像是一种理想化的愿景,但在Agentic RAG的技术支持下,它已经在发生。EIOS的客户中,率先采用Agentic RAG的企业在三个月内观察到了以下变化:新员工寻找业务信息的时间减少了60%,跨部门的信息请求邮件减少了40%,决策前的信息收集时间减少了50%。
五、Agentic RAG的落地路线:从0到1的100天
Agentic RAG不是产品,而是一种能力。企业需要在自己的基础设施上构建这种能力。以下是一个经过验证的100天落地路线图:
第1-15天:知识盘点。把你的企业知识资产全部列出来——内部Wiki、共享文件夹、CRM中的客户记录、ERP中的交易数据、邮件存档、会议纪要、培训材料、操作手册、规章制度。盘点完成后,评估每种知识资产的"价值密度"(对Agent能力有多重要)和"结构化难度"(从当前格式提取为结构化知识的难度)。优先处理高价值密度、低结构化难度的资产。
第16-30天:知识建模。设计知识图谱的Schema——你的企业知识中有哪些核心实体(客户、产品、员工、合同、项目)?它们之间有哪些关键关系?这个设计不需要完美——它应该是一个随着使用不断完善的"活的模型"。初期从最核心的3-5个实体类型和5-10种关系类型开始。
第31-60天:知识抽取和向量化。用Agent自动从文档中提取实体和关系,写入知识图谱。同时将文档向量化存入向量库。这个阶段需要人类的抽查和纠错——Agent的实体提取可能出错(把同一个人名在不同文档中的不同写法认为是两个人),需要人类纠正来不断提升抽取准确率。
第61-85天:开发知识Agent。基于双引擎架构开发知识Agent。这个Agent需要具备:理解自然语言查询、判断查询类型(语义/逻辑/混合)、自动路由到正确的检索引擎、综合多个检索来源的结果、生成带置信度标注的答案。关键是这个Agent的"查全率"和"查准率"——既不能遗漏关键信息,也不能被噪音淹没。
第86-100天:内测、优化、渐进上线。先在内部团队(比如IT部门或某个业务部门)试运行2周,收集反馈和纠正数据。基于真实使用数据优化知识图谱的Schema、改进查询路由逻辑、补充知识缺口。然后逐步向更多部门推广。
六、2026展望:RAG将走向何方?
站在2026年下半年,我们看到的不仅是Agentic RAG的当下成就,更是它通往2026年的演进路径。以下是对未来12-18个月的展望:
跨企业知识联邦:今天每个企业的Agentic RAG都是独立的知识孤岛。但供应链中的企业有大量的知识需要共享——供应商的产能信息对采购方至关重要,客户的信用记录对供应商至关重要。2026年,我们预计会出现基于隐私保护的跨企业知识联邦——Agent可以在不暴露企业原始数据的前提下,跨企业边界检索和推理。联邦学习、同态加密、多方安全计算等技术将为此提供安全基础。
多模态知识图谱:当前的知识图谱主要由文本实体和关系构成。但在企业知识中,图片和视频中蕴含着大量无法完全用文字表达的信息——产品设计图、工艺流程图、设备操作视频。2026年,知识图谱将开始融合多模态信息,让Agent不仅能"知道"存在一个产品设计图,还能真正"理解"图中的关键结构和约束。
自进化知识系统:当前的Agentic RAG仍然需要人类来确认知识冲突和修正错误。2026年,随着Agent自主决策能力的提升和置信度判断的精进,Agent可能会获得在低风险知识更新上的自主权——当它发现一个新文档中的信息与现有知识矛盾,且新文档的权威性明显更高时,它可以自主更新知识库,同时向人类发送一份"我更新了这些知识,请确认"的通知。这将把知识系统从"需要人类喂养"提升到"自主进化"的水平。
知识Agent即操作系统:长期来看,Agentic RAG将不再是企业中的一个"应用"或"功能",而是企业数字操作系统的核心组件。所有其他Agent和业务系统运行在知识Agent之上——知识Agent是企业中唯一负责"知道一切"的组件,所有其他Agent通过它来获取所需的知识。知识即基础设施,知识即平台。
RAG技术的演进——从Naive到Advanced再到Agentic——折射的是整个AI行业从"被动工具"到"主动智能"的大趋势。Agentic RAG不是终点,它是企业知识和AI深度融合的下一个起点。对企业而言,现在开始构建Agentic RAG能力,意味着你的AI Agent将拥有一个持续学习、不断丰富的企业知识大脑——这是竞争壁垒,不是"nice to have"。
宝软数字的EIOS从设计之初就内置了知识图谱和向量搜索的双引擎架构,Agentic RAG是我们的核心能力之一。我们帮助企业将散落在各个系统中的碎片知识,转化为一个不断增长、持续进化的企业知识大脑。
下一篇:AI安全新范式——红队测试+对抗训练+价值观对齐。