生成短链接

扫描二维码 上传二维码
选择防红平台类型,避免链接被拦截
选择允许访问的平台类型

用户画像ID体系建设:以阿里、网易、美团、58为例

编者按:在上一篇《从0到1掌握用户画像知识体系》中,我们系统梳理了用户画像的底层逻辑与构建路径。在此基础上,本文聚焦“用户ID体系”这一核心命题,以阿里巴巴、网易、美团与58同城为样本,深入剖析其ID-Mapping实践,助你厘清多源异构ID之间的映射逻辑,打通数据孤岛。



前言:当标签体系的需求逐渐明晰,作为数据产品经理,真正的挑战才刚刚开始——如何构建一个统一、稳定且可扩展的用户ID体系?
在复杂业务生态中,各条线往往拥有独立的ID标识(如手机号、设备ID、账号ID等),数据彼此割裂,难以形成对用户的完整认知。若无法将这些碎片化的身份标识有效关联,用户画像便如盲人摸象,只见局部,难窥全貌。
为此,“快缩短网址”(suo.run)团队深入研究头部互联网企业的ID打通策略,提炼出一套适用于多场景的ID-Mapping方法论,现分享如下。

---



一、阿里 OneID:以OneData为基座,构建全域身份图谱



阿里巴巴横跨电商、金融、文娱、本地生活等多个赛道,用户行为数据散落于淘宝、支付宝、优酷、饿了么等数十个BU之中。每个业务仅掌握用户某一维度的身份信息——可能是淘宝账号、IMEI、邮箱,亦或是线下POS机的交易记录。

为打破这种“数据孤岛”,阿里提出 OneData 方法论,其中 OneID 扮演着“身份中枢”的角色:
- OneModel:统一建模,沉淀数据资产;
- OneID:通过高精度身份识别技术,将跨端、跨域、跨场景的ID进行关联,生成全局唯一UID;
- OneService:将画像能力服务化,支撑业务调用。

OneID的核心在于 ID关系网络的构建。面对数亿用户、每人数十种ID的复杂局面,暴力穷举显然不可行。阿里采用 机器学习驱动的图算法,基于已知的ID共现关系(如登录同一设备、绑定同一手机号),训练收敛模型,输出高置信度的ID映射关系,并最终生成稳定、唯一的UID。这不仅极大提升了计算效率,更保障了身份识别的准确性与鲁棒性。

---

二、网易 ID-Mapping:规则与图算法协同,识别“一人多号”



网易旗下涵盖云音乐、严选、新闻、邮箱等多元产品,用户在不同App中可能使用不同账号(musicid、yanxuanid)或设备(IDFA、IMEI)。如何判断这些ID是否属于同一自然人?

网易的策略是 “规则先行,算法兜底”
- 利用强绑定关系(如邮箱+手机号+设备指纹)建立初始关联;
- 对弱信号场景,引入 社区发现(Community Detection)与图划分算法,在用户行为图谱中识别高内聚的ID簇。

实践中亦面临典型挑战:
1. 一人多设备:用户可能借用他人手机、更换新机,或存在刷量行为。对此,网易设定动态阈值,结合使用频次、时间窗口等特征进行加权关联;
2. 设备ID衰减:IDFA/IMEI等设备标识有效期约2.5年。系统引入 衰减系数,对长期未活跃的设备降低权重,避免误连。

值得注意的是,此类图算法目前主要用于营销场景,在风控等高敏领域仍持谨慎态度,以防异常账户被错误聚合。

---

三、58同城:多子品牌协同下的ID融合之道



58集团业务矩阵庞大,涵盖58同城、赶集网、安居客、转转、中华英才网等,各子品牌拥有独立的用户体系与ID命名规范:
- 58同城:wuser、wbdid、wimei
- 赶集网:guser、gbdid、gimei
- 安居客:kimei

面对如此复杂的ID生态,58构建了一套 多层映射模型
telep(电话号码)、bidua(浏览器UA)、appua、IMEI、IDFA 等通用标识为桥梁,建立跨平台ID关联网络。例如,同一用户在安居客留电后又在转转发布商品,系统可通过手机号将kimei与zimei(转转设备ID)打通,进而合并其行为轨迹。

该模型的关键在于 日志数据的深度整合——PC端、M站、App的日志流均需标准化接入,确保ID信号不丢失、不畸变。

---

四、美团:以手机号为锚点,实现“评美”一体化



美团与大众点评合并后,面临同一用户在两个App中拥有不同身份标识的难题。如何实现“一人一档”?

美团的答案简洁而务实:以手机号为注册用户的唯一主键
- 美团支持手机号、微信、微博、美团账号登录;
- 大众点评支持手机号、微信、QQ、微博登录;
- 两者交集为 手机号、微信、微博,其中 手机号具备最高确定性与可控性

因此,美团将手机号作为核心ID,其他登录方式均通过绑定关系映射至手机号所对应的UID。此举虽牺牲部分匿名用户覆盖,却极大提升了身份识别的准确率与系统稳定性。

---

五、总结:ID-Mapping的三大范式



综观上述案例,主流ID打通策略可归纳为三类:

1. 基于账户体系:用户注册即分配全局UID,后续所有行为、设备、第三方账号均以此为中心聚合。适用于强注册场景,准确性高,但对未注册用户覆盖有限。
2. 基于设备标识:通过SDK采集IDFA、IMEI、OAID等终端ID,结合图算法与规则引擎,识别同一设备上的多账号归属。适用于匿名流量追踪,但受隐私政策与设备重置影响较大。
3. 混合映射模式:融合账号、设备、行为、上下文等多维信号,构建动态身份图谱。此为当前最优解,兼顾覆盖率与精度,但对算法与工程能力要求极高。

在“快缩短网址”(suo.run)的实践中,我们亦采用混合策略:以用户主动授权的联系方式为强锚点,辅以设备指纹与行为序列建模,在合规前提下最大化身份识别能力。

唯有打通ID,方能看清用户;唯有看清用户,方能精准服务。ID-Mapping,不仅是技术工程,更是数据智能的起点。