自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 一位小白零基础入门新闻推荐Task05--【排序模型+融合模型】

学习目标:提示:这里可以添加学习目标例如:一周掌握 Java 入门知识学习内容:提示:这里可以添加要学的内容例如:1、 搭建 Java 开发环境2、 掌握 Java 基本语法3、 掌握条件语句4、 掌握循环语句学习时间:提示:这里可以添加计划学习的时间例如:1、 周一至周五晚上 7 点—晚上9点2、 周六上午 9 点-上午 11 点3、 周日下午 3 点-下午 6 点学习产出:提示:这里统计学习计划的总量例如:1、 技术笔记 2 遍2、CSDN 技术博客 3 篇

2020-12-06 23:15:00 114

原创 一位小白零基础入门新闻推荐Task04--【特征工程】

学习目标:学习特征工程,主要是制作特征和标签,转成监督学习问题分析特征:文章的自身特征, category_id表示这文章的类型, created_at_ts表示文章建立的时间, 这个关系着文章的时效性, words_count是文章的字数, 一般字数太长我们不太喜欢点击, 也不排除有人就喜欢读长文。文章的内容embedding特征, 这个召回的时候用过, 这里可以选择使用, 也可以选择不用, 也可以尝试其他类型的embedding特征, 比如W2V等用户的设备特征信息上面这些直接可以用的特征,

2020-12-03 23:31:36 69

原创 一位小白零基础入门新闻推荐Task03--【多路召回】

学习目标内容:学习推荐系统里的多路召回,理解新闻推荐系统里的多路召回策略。学习收获:从学习手册里我们学习到多路召回策略的意思。多路召回“多路召回”策略,指采用不同的策略、特征或简单模型,分别召回一部分候选集,然后把候选集混合在一起供后续排序模型使用,可以明显的看出,“多路召回策略”是在“计算速度”和“召回率”之间进行权衡的结果。其中,各种简单策略保证候选集的快速召回,从不同角度设计的策略保证召回率接近理想的状态,不至于损伤排序效果。如下图是多路召回的一个示意图,在多路召回中,每个策略之间毫不相关,

2020-11-30 23:31:06 132

原创 一位小白零基础入门新闻推荐Task02

学习目标:想继续提升Task01中Baseline中的结果,仔细分析数据从新的角度去出发,或许是不错的出发点。接下来,Task02我主要是熟悉了解所有下载下来的数据集的基本情况,以及数据集与数据集之间的那些特征的关联性。弄清楚用户与文章各自的属性和之间的属性。学习内容:1、查看学习总结Task02的数据处理思路2、分析学习收获:0 、相关包情况# 导入相关包%matplotlib inlineimport pandas as pdimport numpy as npimport

2020-11-27 22:07:02 85

原创 一位小白零基础入门新闻推荐Task01

一位小白零基础入门新闻推荐学习目标Task01 赛题理解+Baseline理解阿里云天池新闻推荐的赛题数据和目标,学习理解Baseline中的原理,了解赛题的解题思路。学习内容1、 跑通Baseline2、 学习看懂Baseline代码3、 学习上一期推荐系统基础的基于物品的协同过滤和基于用户的协同过滤,学习评分指标方法。学习收获1、第一步,看代码之前首先搞懂了这些包库模块的作用,方便接下来的Baseline代码理解import time, math, osfrom tqdm impo

2020-11-25 19:11:12 122 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除