自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 学习小白的推荐系统之路——Task 04特征工程

学习目标:掌握制作特征和标签, 转成监督学习问题学习内容:提示:这里可以添加要学的内容例如:1、 搭建 Java 开发环境2、 掌握 Java 基本语法3、 掌握条件语句4、 掌握循环语句学习过程特征分为可以直接利用的特征以及需要构建的特征。我们需要先基于召回的结果, 构造一些特征,然后制作标签,形成一个监督学习的数据集。构造监督数据集的思路, 根据召回结果, 我们会得到一个{user_id: [可能点击的文章列表]}形式的字典。假设得到的他的召回列表{user1: [item1,

2020-12-03 22:48:37 133

原创 学习小白的推荐系统之路——Task 03 多路召回

学习内容1、基于关联规则的itemcf2、基于关联规则的usercf3、youtubednn召回4、冷启动召回学习过程多路召回所谓的“多路召回”策略,就是指采用不同的策略、特征或简单模型,分别召回一部分候选集,然后把候选集混合在一起供后续排序模型使用,可以明显的看出,“多路召回策略”是在“计算速度”和“召回率”之间进行权衡的结果。其中,各种简单策略保证候选集的快速召回,从不同角度设计的策略保证召回率接近理想的状态,不至于损伤排序效果。这便是多路召回的基本概念。下面展现多路召回的一个示意图,在

2020-11-30 22:47:32 309

原创 学习小白的推荐系统之路——Task 02 数据分析

Task 02 数据分析学习内容学习过程导包以及数据读取数据预处理数据浏览用户点击日志文件_训练集学习如何对数据进行各种分析,了解每个文件里有哪些数据,具体的文件中的每个字段表示什么实际含义,以及数据集中特征之间的相关性学习内容1、 导包以及数据读取2、 数据预处理3、 数据浏览4、 数据分析学习过程导包以及数据读取# 导入相关包%matplotlib inlineimport pandas as pdimport numpy as npimport matplotli

2020-11-27 21:25:02 143

原创 学习小白的推荐系统路——Task 01 Baseline

学习小白的推荐系统路——Task 01 Baseline学习目标:三天时间,理解赛题和理解Baseline学习内容:1、 理解和掌握各种库和包的含义和用法2、 掌握节约内存的标配函数3、 看懂Baseline的代码4、 掌握协同过滤算法学习过程:导入各种库和包# import packagesimport time, math, osfrom tqdm import tqdmimport gcimport pickleimport randomfrom dateti

2020-11-25 19:07:47 169 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除