数据分析
文章平均质量分 96
adureychloe
这个作者很懒,什么都没留下…
展开
-
【打卡】零基础入门推荐系统-新闻推荐
赛题以预测用户未来点击新闻文章为任务,数据集报名后可见并可下载,该数据来自某新闻APP平台的用户交互数据,包括30万用户,近300万次点击,共36万多篇不同的新闻文章,同时每篇新闻文章有对应的embedding向量表示。为了保证比赛的公平性,将会从中抽取20万用户的点击日志数据作为训练集,5万用户的点击日志数据作为测试集A,5万用户的点击日志数据作为测试集B。可见节省了很多内存。我们把它存储下来以便以后使用,这里使用hdf5存储。由于数据量比较大,读取占用内存和时间都比较多,考虑对其进行优化。原创 2022-12-11 18:54:33 · 409 阅读 · 1 评论 -
微博大 V 用户画像与热点话题分析
微博大 V 用户画像与热点话题分析原创 2021-01-16 15:36:37 · 3245 阅读 · 0 评论