做用户画像时,大家总喜欢给人群贴上一堆标签,却常常忘了最基本的一点:标签本身好不好用,直接决定了画像系统能不能活下去。举个例子,业务急着要找20到30岁的目标用户,按标签一筛,结果只出来几千人,流量池干得见底,这种标签贴了又有什么用?这就是最核心的问题——没经过质量把关的标签帮不了业务,只会让业务方对整个画像系统失去信任。所以,我们得有一套质量评估体系,把劣质标签拦在门外,也给标签怎么优化指条路。要看一个标签好不好,得从数据、应用和业务三个层面一步步来。

先说数据质量,这是标签能不能立得住的根本,主要看覆盖率和准确率。覆盖率看的是标签能覆盖多少人,也就是有标签的人在总用户里占多少。比如你有100万用户,40万标了男,35万标了女,剩下25万没数据,覆盖率就是75%。要是覆盖率跌破20%,麻烦就大了:你想圈一批人搞活动,结果人太少根本搞不起来,平台统计出来的画像也会跟真实情况差了十万八千里。那些全靠用户自己填的标签,往往最容易在覆盖率上栽跟头。再说准确率,这看的是标签跟事实是不是对得上。还是拿性别来说,本来是男的被标成了女,或者反过来,把这些标错的刨出去,剩下的比例就是准确率。准确率要是太低,标签也就废了。当然,底线定多少,得看业务能容忍多大的误差。
不过,数据好看不代表标签就真好用,应用质量是从产品角度看看它到底好不好使。这里有个常见的坑,就是那种没参照的连续值标签,比如“近30天GMV”。从数据上看,只要没算错,它覆盖率准确率都能接近100%,但业务方往往不爱用。为啥?因为业务人员看到一个孤零零的“1万美元”时,根本不知道这算买得多还是买得少。要解决这个问题,就得给标签加点业务语境,比如把它分成高、中、低价值,或者加上大盘数据的分布曲线做个对比。同样,那种没经过清理的一大长串搜索词标签,用起来也很糟心。怎么看一个标签的应用质量好不好?最实在的办法是看大家用不用它:调用频次、使用热度这些反馈,比什么评估都客观,没人用的标签就该赶紧改改了。
最后也是最不好算、但也最要命的一环,是业务质量。数据是底子,产品是面子,业务质量才是里子——直接看转化和变现。如果一个标签能让营销投放的ROI翻好几倍,那它的业务质量肯定没话说。像购买偏好、对营销的敏感度这种靠复杂算法算出来的深度标签,往往业务价值极高。但评估业务质量有个绕不开的坎:它是个事后指标。你得把标签放到真实场景里跑一跑,才知道它到底有多大威力;而且不同场景跑出来的结果经常天差地别,很难定个统一标准。比较靠谱的做法是,先把数据和应用两道关把住,没问题了再上线;上线后,盯着业务那边的数据回流,看真实的触达和转化效果。这些跑出来的事后结论,就是下一次改标签最好的参考。
立即登录