传统企业请算法工程师,往往是一场美丽的误会。
这种误会的根源,在于双方对“算法”这件事的理解不在一个频道上。企业以为请来的是能点石成金的“魔法师傅”——只要数据喂够了,销量自然来了,库存自动消失了,所有问题都迎刃而解。而算法工程师以为自己面对的是互联网公司那种数据整洁、标签完备的环境,实际情况却是业务逻辑一团乱麻、历史数据惨不忍睹、需求朝令夕改。
结果往往不出半年,双方互相抱怨,不欢而散。
这样的故事我见过太多。

有家传统企业想做用户推荐,从互联网公司挖来算法工程师做了大半年,推荐系统倒是上线了,结果销售部门先炸了锅——推荐的不是滞销品就是根本不愁卖的爆款,完全没有达到预期。市场部负责人甩下一句“阿里推荐也不怎么样”,把工程师晾在原地。
问题出在哪?细看就明白了。这家企业的产品线里,有些是安身立命的爆款,推不推都卖得好;有些勉强维持,推了反而打乱价格体系;还有的产品本身就有硬伤——功能不行、定价离谱,算法再精准也救不回来。工程师没仔细分析业务场景,没理解不同产品在公司里的生态位,一股脑把所有产品丢进协同过滤模型,结果自然一团糟。
还有个例子发生在连锁餐饮企业。老板希望精确预测每天每个SKU的销量,鱼蛋、香肠粉、饭团、面包,每个品类都要求准确无误。这样既不会积压浪费食材,也不会缺货错过生意。听起来很合理对吧?结果七位建模工程师搞了半年,走了四个,剩下的三个垂头丧气,准确率始终达不到预期。
这个目标本身就离谱。预测每个SKU的销量,精度要求百分之百,可能吗?谁要能做到这么精准,早就去炒期货了,何必在这领工资?深入了解后才发现,企业根本没有规范的缺货登记制度,所谓“缺货错过销售”只是业务方口头说说,真正的损失主要来自积压浪费。重新梳理业务目标后,把“精确预测每个SKU”调整为“降低库存损耗率”,问题迎刃而解。两个月后成本明显下降,虽然偶尔有小店缺货,但拿不出数据的抱怨自然也就消停了。
还有一种死法更憋屈——死于业务方的反复横跳。

某大型渠道商希望建立销量预测模型,用来指导手机、平板电脑的备货。模型建好后,业务部门却始终不满意,理由是“预测不准,导致决策失误”。仔细一调查,问题根本不在模型。模型预测的是总销量,但总销量分配到各渠道负责人后,有人看前两周卖得好就拼命追加订单,看前两周卖得差就急着清库存,最后实际销量和预测偏差巨大,回头却怪算法不灵。这种情况下,所谓的预测不准,十有八九是业务方自己瞎操作造成的。
这些问题背后有个共同特征:企业把算法想得太简单,又把算法想得太万能。

2010年前后,数据挖掘工程师主要来自电信和银行项目,那批人对数据分析方法掌握扎实,对数据模型的有效边界心里有分寸,知道什么能做什么不能做。但2017年后人工智能热潮涌起,大量新人涌入算法领域,很多人只是看了几本机器学习书籍,跑过几个鸢尾花数据集,就敢说自己懂算法。他们不知道数据质量的重要性,不理解业务场景的复杂性,更不知道在传统企业里,很多所谓的“需求”根本不是技术问题,而是管理问题。
数据建模本质上是对抗效率低下的工具,帮人们处理手工计算复杂、难以批量操作的问题。这是一种计算方法,不是神秘的力量,更不是能解决一切经营困境的灵丹妙药。算法最擅长的是图像识别、语音转写这些相对客观的领域,而传统企业面临的问题往往是另一副面孔:紧急情况下的临时决策、老板个人偏好导致的选品失误、业务人员凭感觉预测、情绪化订货……这些乱局,更适合用数据分析来解决——通过认真梳理业务流程、诊断实际问题、建立分析框架来逐步改善,而不是指望某个算法模型一步到位。
但从朋友圈的爆款文章到管理层的期望,再到工程师们敲代码的键盘,所有声音都在说算法打败了人类、算法比你自己更了解你、算法实现了百分之九十九的准确预测。这场悲剧不会停止,随着2020年后企业数字化加速,还会有更多类似的剧情上演。
有意思的是,有人可能觉得这些都是传统企业的问题,互联网公司不一样。真是这样吗?生鲜电商就是个例子。疫情以来很多人觉得生鲜电商有前景,于是一群没下过厨房、没买过菜的算法工程师正在研究精准推荐蔬菜、智能预测购买需求的算法。结果不言而喻——还是用熟悉的协同过滤,还是用熟悉的相关规则,面对完全不同的场景,照搬互联网的成功经验,效果自然可想可知。
算法工程师要做的第一件事,是清醒地认识到算法不是万能的。技术在正确的场景下才能发挥价值,而找到这个场景,本身就是最考验功力的技术活。

立即登录