【数据挖掘】新闻推荐比赛 Task2 特征工程

Alex_Shen
2021-12-02 / 0 评论 / 0 点赞 / 64 阅读 / 204 字 / 正在检测是否收录...
温馨提示:
本文最后更新于 2022-04-06,若内容或图片失效,请留言反馈。部分素材来自网络,若不小心影响到您的利益,请联系我们删除。

1. 多路召回定义

所谓的“多路召回”策略,就是指采用不同的策略、特征或简单模型,分别召回一部分候选集,然后把候选集混合在一起供后续排序模型使用
在这里插入图片描述

例如新闻推荐,召回规则可以是“热门新闻”、“作者召回”、“关键词召回”、“主题召回“、”协同过滤召回“等等。

2. 读取模式

  1. debug模式
    抽取小数据集进行训练
  2. 线下验证模式
    利用train数据集进行训练,利用test数据集进行验证
  3. 线上模式
    利用train+test数据集进行训练
0

评论区