需求预测——从拍脑袋到AI概率预测
> 供应链所有的决策都建立在一个假设上:我们知道将来会卖多少。但如果你诚实地面对这个假设——我们从来不知道。我们只是在猜。好的预测和差的预测之间的区别,不在于"谁猜得更准",而在于"谁承认自己是在猜,并用严谨的概率论来猜"。
一、传统需求预测的真实面目
走进任何一家传统企业的月度产销协调会,你会听到这样的对话:销售总监说"下个月我们保守估计能卖500万"。这个"保守估计"是从哪里来的?通常是从Excel表里拉一下去年同期的销量、乘以一个"增长率"(销售总监凭感觉拍出来的)、再加上两个大客户的"口头承诺"。这就是传统需求预测的真实流程——它既不是"科学",也不是"艺术",它更像是"一群有经验的人坐在一起用直觉赌一把"。
这种"拍脑袋预测"造成的后果是连锁的:预测偏高→采购多买了原材料、工厂多排了产能、仓库堆满了库存→发现卖不掉→降价处理→利润被库存减值吃掉。预测偏低→原材料不足、产能排不上、成品缺货→客户等不及→丢失销售机会和客户信任→竞争对手趁虚而入。这两个方向错了都会造成巨大损失,但传统预测在两个方向上的错误率波动非常大。
更深层的问题是预测偏差的责任归属。在传统模式下,销售部门对预测负责,因为他们是"最接近市场的人"。但销售部门的激励结构天然地鼓励"保守预测"——预测低了,实际卖得比预测多,是"超额完成任务";预测高了,实际卖得不够,是"库存呆滞的责任"。这种激励机制导致预测系统性地偏低——而供应链部门为了应对"预测偏低导致的频繁缺货",只能加大安全库存,这就形成了"预测偏低→安全库存偏高→库存成本上升→利润被蚕食"的恶性循环。
打破这个循环需要一个全新的机制:让预测不再依赖于一个人的直觉和一个人的激励结构,而是依赖数据和概率。
二、AI需求预测的五层变量金字塔
传统的需求预测只用一个变量——"历史同期销量"。AI的预测模型考虑的是五个层次的变量,我称之为"预测变量金字塔"。
第一层:历史时序数据。这不是简单的"同期销量",而是对历史销售数据的深度时序分析——趋势(销量是上升还是下降?)、季节性(每年固定时间的波动模式?)、周期性(更长周期的经济波动?)、自相关性(上周的高销量会多大程度地预示本周的高销量?)、事件冲击(什么类型的事件——促销、政策变化、竞争对手动作——导致了历史上的销量异常跳变?)。
第二层:商业驱动变量。这些是企业可控的内部变量——价格变动(提价5%对销量的影响?)、促销强度(折扣深度×推广渠道广度×促销时长)、渠道扩张(新开了多少门店/分销商/电商平台?)、产品更新换代(新旧型号的替代速度?停产信号对最后一批库存的影响?)。
第三层:市场环境变量。这些是外部但可观测的变量——竞争对手的定价和促销活动、替代品的市场渗透率、互补品的市场趋势、行业总需求的宏观数据(如房地产开工面积影响建材品类)。
第四层:宏观与事件变量。这些是从新闻、社交媒体、政策公告中提取的信号——行业政策变化(如新能源汽车补贴退坡)、天气预测(影响空调/取暖器/除湿机等季节性品类)、重大社会事件(体育赛事带动啤酒零食销售、疫情管制影响消费场景)。
第五层:人类输入的软信息。有些信息是"还没有体现在数据中但销售团队已经感知到的"——某个大客户正在考虑换供应商、某个地推团队签下了一个潜在的连锁订单、某个渠道商在抱怨库存积压。这些"软信息"是AI从纯数据中捕捉不到的,必须通过结构化的方式从销售团队中收集,然后编码为模型的一个额外输入。
三、概率预测:从"一个数"到"一个分布"
AI需求预测和传统预测最本质的区别在于输出的形式。传统预测给的是一个数:"下个月预计销量是5320件"。这个数给人的心理暗示是确定的、精确的——但实际上它只是一个"最可能的估计",它的不确定性完全没有被传达出去。
AI预测给的是一个概率分布:"下月销量有50%的概率在4800-5800件之间,有90%的概率在4200-6500件之间,极端的上下限(p95预测区间)是3500-7300件"。这个分布包含的信息量与"一个5320"根本不在一个数量级上。
概率预测在供应链决策中创造的价值是革命性的。当你知道"最可能销量是5320件"时,你能做的决策是"采购5320件所需的原材料"。但当你知道"销量有10%的概率低于4200件"时,你就能做风险对冲——"我按4500件的量采购原材料(覆盖80%的置信区间),同时与供应商谈一个柔性条款——如果需要,可以在2周内追加800件的产能"。
更精妙的是,不同品类的供应链决策需要不同的预测分位数。对于缺货成本极高的战略品类(缺货损失的利润远大于库存积压的损失),你应该按较高的分位数(比如p85或p90)做库存规划——宁可多备一些,也不能缺货。对于库存持有成本极高的品类(保质期短、体积大、资金占用高),你应该按较低的分位数(p50-p60)做库存规划——宁可偶尔缺货,也不能让库存积压。
这就是概率预测的革命性所在——它不要求预测"更准",它要求预测"诚实地告诉你它有多不准"。当你知道了不确定性的大小和分布,你就可以根据你的业务特性(缺货成本vs库存成本)做出最优的风险管理决策。你不是在猜一个数,你是在管理一个概率分布。
四、预测准确率的衡量:告别MAPE崇拜
在传统供应链管理中,有一个被过度崇拜的指标——MAPE(平均绝对百分比误差)。它的计算方法是:每个产品的(|预测值-实际值|/实际值)的平均值。比如你预测了100个SKU的下一周销量,MAPE是25%,意味着你的预测平均偏差了25%。
MAPE确实是一个直观的指标,但它有三个严重的缺陷。第一,它对慢销品极其不友好——你预测某个SKU下周卖1件,实际卖了2件,MAPE是100%——但这个错误在业务上几乎无关紧要(不过是多卖了一件的微小差异)。而一个高销量SKU——预测卖1000件,实际卖了800件,MAPE是20%——这个20%在业务上可能意味着200件的库存积压。
第二,MAPE对"偏低的预测"和"偏高的预测"同等对待,但在供应链中这两种错误的代价是完全不同的——预测太低导致缺货损失,预测太高导致库存积压。
因此,在AI需求预测体系中,应该使用多维度的评估指标:加权MAPE(按销售额加权,让高价值SKU的准确率更被看重)、偏误分析(系统性地偏高还是偏低?这是模型结构性问题而非常规误差)、库存影响评估(直接评估预测误差导致的库存成本和缺货成本,而不只是评估预测误差本身)、预测分位数的校准(AI预测"有90%的概率实际值在预测区间内"——实际数据验证是否真的90%落在区间内?)。
五、将预测转化为决策:S&OP的AI化
需求预测本身不是目的,将预测转化为供应链决策才是目的。传统上这个过程被称为S&OP(销售与运营计划)——一个跨部门的月度会议,销售、市场、供应链、财务坐在一起,对齐需求预测、供应计划、财务预算。
AI时代的S&OP从"月度对齐会议"变成了"持续自动化的供需匹配"。AI Agent持续运行需求预测模型,将每个SKU的概率预测与当前的库存、在途订单、供应商产能、生产排程做自动匹配。当匹配结果出现缺口(需求可能超过供应)或过剩(供应可能超过需求)时,AI自动生成预警和方案。人类管理者不再每个月花两天时间准备和开会,而是每天花15分钟看AI生成的S&OP仪表盘——哪些品类有供需缺口?AI建议了哪些调整方案?他只需要就AI建议做"批准"或"修改"的决策。
这个转变的意义是:S&OP从"回顾历史"变成"前瞻管理"——传统的月度S&OP会花大量时间在"上个月为什么没达标"的回顾分析上(因为数据滞后,只能回顾),而AI驱动的S&OP把80%的时间放在"未来可能会发生什么,我们应该怎么应对"的前瞻决策上。
六、部署AI需求预测的实战建议
不要追求"全域预测"。选择你企业中需求最难预测、库存成本最高的品类作为首发品类——比如季节性很强的品类(预测准确率本身就低,AI的提升空间大)、或者单价较高的品类(库存积压的代价大,预测改善的财务回报高)。在这些高价值品类上验证AI预测的效果后,再扩展到全品类。
不要一上来就用深度学习。先用统计学基线模型(移动平均、指数平滑、ARIMA)建立基准预测准确率。如果AI模型(如LightGBM、XGBoost)不能显著高于基线,就在数据和特征工程上继续投入——而不是增加模型的复杂程度。记住:好数据+简单模型 > 烂数据+复杂模型。
让销售团队提供"增量信息"而非"替代预测"。不要让销售填"下个月预测销量是多少"——这是AI在做的。让销售提供"AI不知道的信息"——哪些大客户在考虑增减采购量、哪些竞争对手在做大促、哪些渠道在调整合作模式。这些"软信息"是对AI模型的补充,而不是替代。
建立预测偏差的可追溯机制。每个月固定一次"预测vs实际"的复盘——不是追责("谁预测错了"),而是诊断("为什么预测偏差这么大?是模型忽略了什么信息?还是出现了完全不可预见的黑天鹅事件?")。这种复盘机制持续改善的是预测体系本身——包括数据的完整性、模型的结构、软信息的编码方式。
本文基于EIOS需求预测Agent的应用实践。该Agent融合时间序列、机器学习和宏观事件分析,在多个行业的实际部署中将预测准确率(加权MAPE)从35-45%改善至15-22%。