我们的机器学习平台一度陷入了“训练-服务偏斜”的泥潭。线上模型消费的是实时用户行为事件,而离线训练任务则依赖于数据湖里经过T+1批处理的特征。这种不一致性导致模型在线上表现远逊于离线评估,模型迭代的效果验证也成了一门玄学。最初尝试用一个简单
2023-10-27