企业AI项目失败的第二大原因(仅次于数据问题)是什么?是"找错了人"。传统软件项目的团队结构直接套用到AI项目上几乎注定失败——不是因为这些人不优秀,而是因为AI项目需要的角色和协作方式与传统项目有根本性的不同。
宝软数字在为127家企业搭建AI团队的过程中,抽象出了10个关键角色。对于中小企业(50人以下),其中6个为核心角色;对于大型企业,10个角色建议全部配置。
├── AI产品经理 · AI技术负责人
├── Prompt工程师 · AI训练师/数据标注管理员
├── AI应用开发工程师 · ML/LLM运维工程师
└── 业务领域专家 · AI伦理合规专员 · 变更管理/培训专员
一、领导层角色(2个)
核心职责:对AI项目的业务成果负总责。不是"管技术的",而是"把AI转化为业务价值"的人。负责预算编制、ROI追踪、干系人管理、跨部门协调。
为什么不能由IT总监兼任:IT总监的KPI通常是系统稳定性和项目按时交付,而AI项目的KPI是业务价值的持续增长。两者在资源分配和优先级上经常冲突。
关键能力:理解AI的能力边界(不需要懂技术细节)、商业敏锐度、跨部门推动力、向上管理能力。
核心职责:技术架构决策、技术风险把控、AI工程质量标准制定。对外对接AI供应商的技术评估,对内领导工程师团队。
与AI项目负责人的分工:AI项目负责人回答"做什么和为什么",AI技术负责人回答"怎么做和能不能做"。AI技术负责人对AI项目负责人虚线汇报,实线汇报给CTO。
关键能力:LLM/RAG/Agent架构经验、生产环境部署经验、技术选型能力、团队技术领导力。
二、产品与设计角色(2个)
核心职责:定义AI解决的问题、设计人机协作体验、管理AI产品需求优先级。这是连接业务需求和技术实现的"翻译官"角色。
与传统PM的区别:AI产品经理需要理解AI的能力边界和不确定性。传统PM的需求是确定的("点击按钮弹出表单"),AI PM的需求是不确定的("AI理解用户意图并给出建议")。需要管理"概率性产品"——AI的输出不是100%确定的。
关键能力:Prompt工程基础、用户体验设计、数据驱动决策、对AI不确定性的容忍和管理能力。
核心职责:提供领域知识和质量标准。回答"AI的这个输出在业务上是否正确",评估AI输出的业务可用性。
为什么必须要有这个角色:AI技术负责人和产品经理都很难判断AI在专业领域(如财务准则、法律条款、医疗诊断)的输出是否准确。领域专家的"直觉判断"往往是第一时间发现AI质量问题的关键。
关键能力:行业深度经验(5年以上)、愿意学习AI基础概念、客观评估而非"我觉得不对"。
三、工程实现角色(4个)
核心职责:设计、测试、迭代优化Prompt模板。管理Prompt版本库,建立Prompt评估体系(A/B测试、Golden Dataset回归测试)。
这不是一个"随便谁都能干"的角色:优秀的Prompt工程师需要同时具备逻辑思维(结构化的指令设计)、语言能力(精准的表达)和实验思维(假设-验证-迭代)。和传统开发不同,Prompt调试没有编译器帮你检查——全靠经验和系统性的实验方法。
关键能力:结构化思维、精准的语言表达能力、A/B测试方法论、基础Python能力。
核心职责:开发AI应用的后端服务和前端界面。集成LLM SDK、搭建RAG管道、实现Agent工具、对接企业现有系统API。
与传统后端开发的不同:AI应用开发的核心挑战不是CRUD,而是处理AI的不确定性——流式响应管理、Token消耗优化、模型切换的抽象层设计、多Agent编排。传统的"请求-处理-返回"模式被"流式生成-实时推送-用户可中断"的模式取代。
关键能力:TypeScript/Python、LLM SDK经验、流式数据处理、REST/WebSocket、Vector DB基础。
核心职责:模型部署、推理服务管理、监控告警、成本追踪、模型版本管理。确保AI服务在生产环境中稳定、高效、经济地运行。
为什么需要这个专门的运维角色:传统DevOps监控的是CPU/内存/磁盘/网络,而LLMOps还需要监控Token消耗、模型漂移、Prompt效果衰减、缓存命中率、单次调用成本——这些都是传统监控工具覆盖不到的。
关键能力:K8s/Docker、GPU资源管理、LLM推理优化(量化/批处理/缓存)、监控工具(Prometheus/Grafana + LLM专属指标)。
核心职责:管理数据标注流程和质量,构建和更新AI评估数据集(Golden Dataset),持续收集和整理Bad Case用于模型改进。
这个角色在RAG项目中也重要:即使不做模型微调,也需要有人持续维护RAG知识库的质量——更新过时文档、添加新的FAQ、修正错误信息。这个角色就是"AI的老师",持续地教AI更好的回答。
关键能力:细心和耐心(核心素质)、业务理解力、数据标注工具使用、基础数据分析能力。
四、支撑角色(2个)
核心职责:确保AI系统符合法律法规和伦理规范。组织算法安全评估、管理AI合规文档、对接监管检查、处理AI伦理事件。
建议配置:对于金融、医疗、政务等行业,建议配置专职人员。其他行业可由法务或合规部门人员兼任,但需接受AI伦理专项培训。
核心职责:推动AI在组织内的采纳。设计和执行AI培训计划、管理内部沟通(成功案例宣传、FAQ解答)、收集用户反馈、识别采纳障碍。
为什么不能省:再好的AI工具也需要有人推动用户去使用。技术团队往往不擅长"推销"和"培训",业务部门又不了解AI的细节。这个角色填补了中间的空白。
五、不同规模企业的团队配置建议
中小企业配置方案(6人核心团队)
- AI项目负责人(1人,可由CTO或业务VP兼任)
- AI技术负责人(1人,可兼MLOps和部分开发)
- AI产品经理(1人,可兼Prompt工程和变更管理)
- AI应用开发工程师(2人)
- 业务领域专家(1人,兼职,按需参与)
注意:即使人手紧张,AI产品经理和AI技术负责人这两个角色也不能由同一个人担任——一个是"做正确的事",一个是"正确地做事",两者需要相互制衡。
大型企业完整配置(10个角色)
在6人团队基础上增加:Prompt工程师(1-2人专职)、MLOps工程师(1人专职)、AI训练师(1-2人专职)、AI伦理合规专员(1人,可兼)、变更管理专员(1人,可兼)。
六、AI团队建设的三个阶段
AI团队不需要一步到位全部配齐。根据宝软数字的经验,企业AI团队建设可以分为三个阶段逐步推进:
阶段一:启动期(0-3个月)——3人最小可行团队
- AI产品经理(1人):定义场景、收集需求、协调业务部门。这是团队的"翻译官"。
- AI技术负责人(1人):技术选型、架构搭建、指导开发。这个人决定了技术方向是否正确。
- AI应用开发工程师(1人):具体实现和交付。
这三人组合可以完成第一个MVP的开发和上线。目标是快速验证价值,用成果争取更多资源。
阶段二:成长期(3-9个月)——6人核心团队
在MVP验证成功后,团队扩展到6人(即前文所述的中小企业配置方案)。这个阶段的核心任务是规模化推广和深度优化。
阶段三:成熟期(9个月以上)——完整10人团队
当AI已经渗透到多个核心业务流程后,按完整配置补齐所有角色。这个阶段的特点是从"项目制"转向"平台化"——AI成为企业的基础能力而非某个部门的专属工具。