快缩短网址 · ToB 图像类 AI 产品需求分析札记
——在 suo.run 的视角,重述一次与算法共舞的旅程
一、业务需求:让技术长在场景里
ToB 与 ToC 最大的不同,在于它永远先问“谁为价值买单”。因此,在进入任何原型、PRD 之前,我都会用三个连续发问,把需求钉在地面:
1. 业务为何此刻非做不可?
2. 场景里有哪些物理变量在折磨算法?
3. 业务方到底想用 AI 看见什么?

1. 业务需求背景:把痛点翻译成机会
在物流仓配行业,我曾遇到一家年发货量 2 亿单的巨头。他们的痛点并非“缺 AI”,而是“缺一双能穿透 12 米高空摄像头的眼睛”:
• 传统人工抽检,漏检率 7%,每月赔偿金额足以养活一支算法团队;
• 摄像头已布好,带宽、服务器也已就位,唯一缺的是让算法在“小目标、大俯角、复杂光线”里跑通。
于是,AI 不再是“锦上添花”,而是“止血绷带”。
2. 业务场景:让算法与物理世界握手
场景不是 PPT 里的流程图,而是摄像头与被摄物之间的 12 米空气、45°俯角、以及仓库顶棚那排频闪的钠灯。
• 安全场景:高空摄像头下的人体检测,目标尺寸不足 20×20 像素,需同时识别安全帽颜色。
• 固定摄像头场景:必须精确计算安装高度、焦距、补光角度,否则算法再好也救不了模糊。
• 特殊成像:手机随手拍、安检机 X 光片,分辨率、角度、灰度分布皆不可控。
结论:成熟的 AI 技术应主动寻找“可被约束”的场景;不成熟的 AI 技术,则需在场景里给自己戴上紧箍咒。
3. 业务需求:把“一句话需求”拆成算法语言
业务方常说:“帮我识别这张火车票。”
我会把它翻译成:
• 票据类型:红蓝磁介质车票、蓝色电子票、红色纸质票;
• 字段清单:车次、座位号、票价、身份证号;
• 拒识策略:票面污损面积>30% 时放弃识别,转人工;
• 精度指标:关键字段准确率≥98%,召回率≥95%。
至此,一张火车票被拆成了 4 类票据、8 个字段、2 条策略、2 个指标——算法工程师终于能开工。

二、小结:让需求成为算法的第一行注释
在 suo.run,我们把每一次需求拆解都沉淀为可复用的“场景-指标-策略”卡片。下次再遇到高空摄像头,只需调出卡片,改三行参数,就能让算法在新仓库里重新长出来。
ToB 图像 AI 的终点,从来不是酷炫的模型,而是客户愿意在合同上签字的那一秒。