加入收藏 | 设为首页 | 会员中心 | 我要投稿 菏泽站长网 (https://www.0530zz.cn/)- 数据工坊、负载均衡、数据快递、云计算、事件网格!
当前位置: 首页 > 大数据 > 正文

2020挑战中学到了什么

发布时间:2021-05-22 21:15:40 所属栏目:大数据 来源:互联网
导读:ecommender系统是现代社交网络和电子商务平台的重要组成部分。它们旨在最大限度地提高用户满意度以及其他重要的商业目标。与此同时,在以根据用户兴趣定制内容为目的来建立新模型基准测试时,缺乏供学界研究使用的大规模的公共社交网络数据集。而在过去的一

ecommender系统是现代社交网络和电子商务平台的重要组成部分。它们旨在最大限度地提高用户满意度以及其他重要的商业目标。与此同时,在以根据用户兴趣定制内容为目的来建立新模型基准测试时,缺乏供学界研究使用的大规模的公共社交网络数据集。而在过去的一年里,我们努力解决了这个问题。 

Twitter与RecSys会议展开合作以支持2020挑战赛。在两周的时间里,我们发布了一个包含推文和用户参与度组成的数据集,其中有1.6亿条公开推文用于训练,4000万条公开推文用于验证和测试。    

在这篇文章中,我们描述了数据集以及Nvidia、Learner和Wantely团队提交的三个获奖作品。我们试图对帮助获奖者取得成绩的选择做出一般性的结论,特别是:

以最快的实验速度用于特征选择和模型训练

  • 有利于泛化的对抗验证[1]

  • 上下文特征的使用

  • 在神经网络上使用决策树

我们希望这些研究结果对更广泛的研究界有用,并启发推荐系统的未来研究方向。

挑战赛的参与者被要求预测用户参与四种互动中任何一种互动的可能性:赞、回复、转发和引用tweet。我们根据以下两个指标对提交的作品进行评估:相对于我们所提供的简单基准方法的相对交叉熵(RCE),以及Precision-Recall曲线下的面积(PR-AUC)。

(编辑:菏泽站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读