AI项目第一次上线全军覆没——做错了什么

宝软数字 · 客户成功故事 · 2026年11月20日

你可能会想，科技公司上AI项目应该更顺利吧？

杭州维创信息技术有限公司的CTO方锐告诉你：恰恰相反。科技公司的AI项目更容易翻车——不是因为技术不行，而是因为"我们以为自己很懂"。

2025年6月，维创信息启动了一个内部AI项目——目标是用大语言模型改造公司的客户服务、项目管理、知识管理三个核心业务场景。维创本身就是一家给企业做信息化解决方案的科技公司，100人的团队里有40个是工程师。方锐觉得这是"小菜一碟"。

他错了。错得离谱。

2025年9月，AI系统首次内部上线。结果是灾难性的——知识库返回了大量错误答案、客服机器人把客户气到打电话投诉、项目经理发现AI生成的计划完全是不可执行的。上线第一天晚上，方锐关掉了所有AI功能。那个周末，他在办公室待了两天，反复问自己一个问题："我们到底是哪里做错了？"

一、错误一：把AI当成搜索引擎

维创的第一个致命错误，是对AI能力的认知错位。

方锐当时给技术团队定的目标是："让AI搜索我们所有的内部知识库、项目文档、客户历史记录，当员工问任何问题时，AI直接给出答案。"听起来很合理。但实现的方式是：把公司五年来积攒的大约1.2万份文档——Word、Excel、PDF、Wiki——一股脑塞进了一个向量数据库，然后接上一个大语言模型，让它在这些文档里"搜答案"。

问题很快就暴露了。一个销售问AI："我们给XX公司做的那个物流管理系统，用的什么技术架构？"AI返回了另一个完全不相关项目的架构文档，因为那篇文档里的关键词跟问题有最高的向量相似度。

另一个项目经理问AI："上个月项目的延期率是多少？"AI从三份不同的月度报告里分别摘了一句话拼在一起——每句话单独看都对，但拼起来的数据是三种不同统计口径下的值，完全牛头不对马嘴。

最严重的是，一个客户问维创的客服机器人："你们的实施周期一般多久？"AI从一份2019年的项目方案书里找到了一个"标准实施周期90天"的答案。但事实上，维创的产品和流程在过去五年里已经迭代了三次，现在的典型实施周期是25天。客户收到"90天"的答案后，直接打了商务总监的电话："你们也太慢了，我找别人了。"

"我们犯了一个根本性的错误：把AI当成了Google——以为给它一堆文档，它就能从中找到正确的答案。事实是，AI擅长的是'根据输入生成最像答案的文本'，而不是'根据事实给出正确答案'。这两者有天壤之别。" —— CTO方锐

二、错误二：没有做好数据分层

维创的第二个错误在于没有区分不同类型的数据应该用什么方式处理。

方锐后来把数据分了三层，才发现之前犯了多少低级错误：

第一层：确定性数据。比如合同金额、项目人员、工时记录、客户联系方式。这些数据在ERP或CRM系统里有唯一的、权威的数据源。AI永远不应该去"理解"或"推断"这类数据——它应该直接调用系统API获取精确值。维创却试图让AI去从一堆PDF合同里"提取"合同金额，结果AI把一个项目的一期合同金额（80万）当成了整个项目的总金额（320万）。

第二层：半确定性数据。比如技术方案的选型建议、常见问题的标准答案、实施流程的最优顺序。这类数据有"最佳实践"但不是唯一的正确答案。AI可以做参考建议，但必须在答案中标注信息来源和置信度，让使用者自己判断。

第三层：生成性数据。比如方案书的初稿、邮件的草稿、会议纪要的整理。这是AI最擅长的领域，因为输出不需要100%准确——它提供的是一个可修改的起点。但维创在首次上线时，把所有精力都放在了第一层（确定性数据）上，反而忽略了第三层才是最容易见效的切入口。

方锐说："我们想挑战最难的，结果输给了最基本的数据治理问题。"

三、错误三：没有灰度，没有回退，全量上线

第三个错误最不应该发生在维创——作为一家经常给自己的客户做系统上线的科技公司，他们竟然对自己的内部项目犯了这个大忌。

方锐当时的逻辑是："AI跟ERP不一样，不需要太复杂的切换方案。反正就是把原来的查询方式替换成AI对话的方式，大家适应一下就好了。"所以他在一个周五的下午给全员发了一封邮件——"下周一全员开始使用AI工作台，所有查询、客服、知识检索都通过AI完成。"就切换了。

没有灰度发布——所有人都同时切换到新系统。没有回退机制——旧系统被直接关停，想回都回不去。没有AB对照——不知道到底是AI不行还是使用方法不对。

结果是灾难性的。周一上午9点到10点，客服部接了14通客户投诉电话，全部跟AI客服给出了错误答案有关。项目经理发现无法从AI获取准确的项目历史数据，纷纷回到原来的方式——打电话问同事。销售团队干脆放弃了AI工具，自己翻硬盘里的旧文档。

到周二下午，整个公司已经形成了"AI不好用"的共识——这个共识一旦在组织里形成，翻盘的难度就放大了十倍。因为人们不再给你反馈和改进的机会，他们只是绕开你的系统。

"我们在客户项目上都知道要灰度、要AB测试、要回退方案。到了自己身上就全忘了。可能是因为觉得AI很酷，想一步到位展示给所有人看。结果展示的不是AI有多酷，而是我们有多蠢。" —— CTO方锐

四、错误四：低估了Prompt Engineering的难度

维创的工程师们用了大约两周写了一套Prompt模板。方锐以为两周足够了——"不就是告诉AI该干什么吗？"

事后他才知道，Prompt Engineering是整个AI落地过程中最被低估的环节。不是"告诉AI干什么"这么简单，而是"如何确保AI在不同的上下文、不同的用户、不同的输入质量下，持续给出可靠的结果"。

维创的失败案例里有一个经典的例子：客服场景的Prompt里写的是"请用专业、友好的语气回答客户问题"。结果呢？AI在面对一个愤怒的客户时，依然用"友好"的语气回复了一长段洋洋洒洒的解释——客户读完更生气了："你能不能别废话了，告诉我到底能不能退？"

另一个例子更致命：项目管理场景的Prompt里有"请根据项目历史数据，推荐最佳的执行方案"。但Prompt里没有限定AI"只能引用已经验证过的项目数据，不可以捏造数据"。结果AI在某个方案的推荐里，捏造了一个根本不存在的"历史项目"作为案例依据。项目经理差点就照着执行了——直到他打电话去问那个所谓的"历史项目"的负责人，对方说："我们从来没做过这个项目。"

方锐总结Prompt Engineering的教训是："好的Prompt不是告诉AI干什么，是精确地框定AI不干什么。限制比指令更重要。"

五、错误五：AI替代了流程，但没有替代判断

最后一个错误是最根本的。方锐说："我们设计系统的时候，思考方式是'这个流程能不能用AI替代'。但我们忘了问一个更关键的问题——'这个流程里，哪些环节需要人的判断？'当我们用AI把整个流程替代掉了，人的判断也被一起替代掉了。然后我们就收获了一堆符合规则但完全不合理的结果。"

他举了一个例子。维创的项目管理流程里有一个环节是"项目风险评估"。原来的流程是：项目经理根据项目的规模、技术复杂度、客户配合度、交付时间压力等维度，手动打一个风险等级，然后给出对应的风险缓解建议。

AI上线后，这个流程变成了自动化的——AI读取项目的各项参数，自动计算风险等级，自动生成缓解建议。听起来完美。但第一个真正出问题的项目上，AI给出的风险等级是"低"。项目经理就没有再仔细检查，直接提交了。结果那个项目因为一个AI完全没有考虑到的因素——客户方的项目对接人突然离职——导致整个项目延期了六周。

"AI不知道客户方的对接人可能离职。它只能基于输入的数据来判断。输入的数据里没有'人的不确定性'这个维度，但它应该有一个'未知风险缓冲'的提醒。我们没有设计这个。我们把AI当成能预测一切的算命先生了。"

六、三个月翻盘：把EIOS当成"第二颗引擎"

维创的首次AI项目在2025年9月全线回退。方锐做了一件事，让整个公司的心态从"AI骗人"转变为"我们需要AI"——他请了宝软数字的EIOS团队来帮忙复盘和重新规划。

选择品牌商而不是自己硬扛的原因，方锐说得很直白："我们自己在坑里，看不清坑的边缘在哪里。需要一个站在坑外面的人告诉我们——你离爬出去还差三步。"

EIOS实施团队进场后，做了四件事，方锐说每件事都打在了要害上：

第一，推翻了AI等于搜索引擎的认知。重新规划了数据分层：确定性数据走API直连（接ERP/CRM），半确定性数据走Agent路由（客服和项目管理的场景化处理），生成性数据走LLM（文档和方案生成）。三层完全隔离，互不干扰。

第二，用EIOS的客服Agent替换了自研的对话系统。方锐承认："我们自己花了三个月写的客服Prompt，不如EIOS预置的行业模板管用。因为他们已经在一百多个客户那里迭代了不知道多少轮。"

第三，从"全量上线"改为"单场景灰度"。先只上线文档Agent的会议纪要生成功能——这个场景错误容忍度高、用户感知强、几乎没有风险。三周跑通后，再逐步扩展。

第四，建立了AI输出的"人核机制"。所有AI给出的确定性信息（合同金额、项目人员、工时数据）必须标注"来自系统API，数据时间：XX"，用户可以一键跳转查看原始数据源。所有AI给出的建议性信息（方案推荐、风险提示）必须标注"建议仅供参考，请结合实际情况判断"。

2026年1月，新的AI系统逐步灰度上线。这一次，方锐没有给全员发邮件。他只是把文档Agent的入口开放给了三个最积极的部门经理，让他们先用起来。一个月后，其他部门主动来问："那个会议纪要自动生成的，我们也能用吗？"

"第一次上线我的心跳是120——因为我知道大家都在盯着，一出问题就是全员看着你出丑。第二次上线我一点都不紧张——因为我知道哪怕有问题，也只影响一小批人，我有足够的时间改。" —— CTO方锐

从全公司范围来看，新的AI系统在灰度发布后的效果与第一次形成了鲜明对比。文档Agent在第一个月被使用了627次——全部是员工自发的使用，没有任何强制要求。使用的场景也越来越丰富：项目经理用它来整理客户需求文档，销售用它来生成投标书的技术部分草稿，HR用它来归纳面试评价。方锐看着后台的使用数据说："第一次上线是我们在推AI，第二次是AI在被人拉着跑。"

到2026年6月，重新上线半年后，维创的AI系统已经覆盖了文档、客服、项目管理、培训四个场景，日均使用次数超过1200次，员工主动使用率达到86%。更重要的是，维创把第一次失败的每一个错误、每一次复盘、每一轮改进方案都整理成了一本内部手册——"AI项目实施避坑指南"，在新员工入职时作为必修教材。方锐说，这本书的价值可能比系统本身还要持久。

到2026年6月，重新上线半年后，维创的AI系统已经覆盖了文档、客服、项目管理、培训四个场景，日均使用次数超过1200次，员工主动使用率达到86%。第一次上线的那些噩梦，变成了团队内部培训新员工的"经典反面教材案例库"。

方锐在年度技术总结里写了一句话："AI项目失败不可怕。可怕的是失败了还不知道为什么。更可怕的是失败了之后不敢再来一次。只要你知道错在哪，每一脚踩过的坑都在缩短你到达目的地的时间。"

AI项目不能靠"自研蛮干"？

让踩过一百个坑的人帮你少踩九十九个。预约一次免费AI实施评估。

🔍 预约分析