宝软数字 · 产品深度解读 · 2025-08-29
人类的记忆从来不是精确匹配的。你不会用大脑的SQL查询"SELECT * FROM memories WHERE keyword = '那次客户投诉'"。相反,你会触发一个模糊的联想——"那个愤怒的客户,他好像是因为交付延迟……等等,那次最后是怎么解决的来着?"——然后大脑自动检索出语义最相近的经历。
EIOS的向量记忆库模仿的就是这种语义联想式的记忆检索。它不靠关键词匹配,而是靠意义相似度。它让AI面对一个新问题时,能够"想起"之前处理过的类似情况,然后借鉴经验。
向量记忆库的核心魔法是Embedding(嵌入)——将一段文本转换为一组高维数字向量(通常是768维或1536维),使得语义相近的文本在向量空间中距离也近。
举个例子。三句话:
在向量空间中,前两句话的向量距离非常近(因为它们表达的是类似的语义),而它们和第三句话的距离很远。Embedding模型(如OpenAI的text-embedding-3-large或开源的bge-large-zh)负责完成这个"语义→向量"的转换。
对于EIOS来说,每一次Agent的决策过程——包括它的Thought、Action、Observation和最终结论——都被编码为向量,存入向量库。
Embedding的本质是:用数学来表达语义。它把人类语言中微妙的"意思相近",转化为计算机可以高效计算的"距离相近"。
EIOS的向量存储采用双引擎架构,分别针对不同的部署场景和性能需求。
pgvector(PostgreSQL扩展):适用于单租户或小规模部署。它直接嵌入在PostgreSQL中,和业务数据存在同一个数据库实例里。优势是运维简单——不需要额外的服务,不需要额外的网络跳转。支持IVFFlat和HNSW两种索引算法,在百万级向量规模下性能良好。
Pinecone:适用于多租户或大规模部署。它是专为向量搜索设计的云原生服务,支持十亿级向量规模,提供亚秒级的语义搜索。内置多租户隔离(通过namespace),确保不同客户的数据不会相互混入检索结果。
两种引擎通过统一的向量存储接口进行抽象——业务代码调用vectorStore.insert(embedding, metadata)和vectorStore.search(queryEmbedding, topK),不关心底层是pgvector还是Pinecone。
和知识图谱一样,向量库也不是"什么都记"的垃圾桶。EIOS对入库的记忆有严格的质量标准:
决策记录:Agent的每次L1及以上操作,其完整的Thought-Action-Observation-FinalDecision链路会被编码为向量。这形成了AI的"经验库"。
异常处理:Agent在处理异常情况时的策略和结果——特别是那些成功的错误恢复案例。这些是最高价值的经验,因为它们代表了系统学到了"如何应对意外"。
人工反馈:当人类审批者修改了Agent的建议方案,修改前后的差异被记录为"人类专家如何修正AI"的案例。这是最有价值的训练数据。
不入库的信息:临时计算中间值、常规的成功操作(如果没有异常,就没有学习的价值)、重复的查询结果。
向量搜索的naive实现是:把查询文本编码为向量,然后返回最相似的Top-K条记忆。但这个问题比看起来复杂。
单纯依赖向量距离可能导致表面相似但无实质帮助的检索结果。比如,Agent在处理"供应商A延迟交付"的问题时,可能会检索到很多"关于交付延迟的讨论"的记忆——但其中大部分讨论的是延迟的影响,而非延迟的解决方案。
EIOS的向量检索增加了元数据过滤层:除了向量距离,还考虑记忆的类型标签("问题诊断"vs"方案建议"vs"事后复盘")、时效性(最近6个月的记忆权重更高)和有效性标记(该记忆对应的决策最终是否成功)。
好的记忆检索不只是"相似的",更是"有用的"。这需要元数据的辅助判断——就像一个优秀的图书管理员不仅要找到相关的书,还要找到能解决你实际问题的那一本。
在第四章我们讨论过,Agent完成会话后会被销毁。但它的经验通过向量记忆库留了下来。
当一个新的Agent(Agent-2)面对一个类似的任务时,它在第一个Thought阶段就会调用向量检索工具:"搜索与当前任务最相似的5条历史决策记录"。这些记录作为上下文参考注入到Agent-2的推理中。
这意味着:
Agent-2不会重复Agent-1的错误。如果Agent-1因为某个查询参数设置过大导致超时,Agent-2在检索到的记忆中看到"缩小查询范围后成功",它会自动采用更小的参数。
Agent-2会借鉴Agent-1的成功策略。如果Agent-1发现"先查知识图谱再做向量搜索"比"直接向量搜索"的准确率高30%,Agent-2会复制这个策略。
这就是跨代学习——每一个被销毁的Agent都为后来的Agent留下了遗产。
最后,我们回到商业层面。向量记忆库解决了AI落地中最让人沮丧的一个问题:"上次明明处理得很好,为什么这次又搞砸了?"
没有记忆的AI系统就像一个没有经验的实习生——你可以给他详细的操作手册(System Prompt),但面对手册没有覆盖的灰色地带,他只能从头摸索。
有了向量记忆库,AI系统变成了一个"见过世面"的专家。面对新问题时,它不是从零推理,而是先检索:"我之前处理过类似的情况吗?当时是怎么做的?结果如何?"
这带来的商业效益是双重的:
效率提升:Agent不需要在每次处理类似问题时重新"试错",平均推理步骤从12-15步降低到8-10步,响应速度提升30-40%。
质量一致性:类似的问题得到类似的、经过验证的处理方案,避免了"上次做得好、这次做砸了"的不确定性。
记忆不是让AI变得更聪明,而是让AI变得更可预测。在商业场景中,可预测性比聪明更重要——因为你不能把关键业务交给一个"时而天才时而糊涂"的系统。
明天,我们将迎来这个系列的收官之作——审计全链路。看看EIOS如何确保AI的每一个推理步骤都被完整、不可篡改地记录下来,为企业的AI治理提供最终的安全保障。