Datawhale组队学习
孟德尔的杂交豌豆
三本高校大三学生
展开
-
排序、搜索和计数
排序,搜索和计数 文章目录排序,搜索和计数排序numpy.sort()numpy.argsort()numpy.lexsort()numpy.partition()numpy.argpartition()搜索numpy.argmax()numpy.argmin()numppy.nonzero()numpy.where()numpy.searchsorted()计数numpy.count_nonzero() 排序 numpy.sort() numpy.sort(a[, axis=-1, kind='quic原创 2020-10-31 23:18:17 · 125 阅读 · 0 评论 -
GBDT+LR
1. GBDT+LR简介 前面介绍的协同过滤和矩阵分解存在的劣势就是仅利用了用户与物品相互行为信息进行推荐, 忽视了用户自身特征, 物品自身特征以及上下文信息等,导致生成的结果往往会比较片面。 而这次介绍的这个模型是2014年由Facebook提出的GBDT+LR模型, 该模型利用GBDT自动进行特征筛选和组合, 进而生成新的离散特征向量, 再把该特征向量当做LR模型的输入, 来产生最后的预测结果, 该模型能够综合利用用户、物品和上下文等多种不同的特征, 生成较为全面的推荐结果, 在CTR点击率预估场景下使原创 2020-10-29 21:07:06 · 123 阅读 · 0 评论 -
数学函数和逻辑函数
文章目录向量化和广播数学函数算数运算numpy.addnumpy.subtractnumpy.multiplynumpy.dividenumpy.floor_dividenumpy.powernumpy.sqrtnumpy.square三角函数numpy.sinnumpy.cosnumpy.tannumpy.arcsinnumpy.arccosnumpy.arctan指数和对数numpy.expnumpy.lognumpy.exp2numpy.log2numpy.log10加法函数、乘法函数numpy.su原创 2020-10-27 23:24:49 · 324 阅读 · 0 评论 -
Task 4 Wide&Deep
文章目录1. 点击率预估简介2. FM它不香吗3. Wide & Deep模型的“记忆能力”与“泛化能力”4. 操作流程5. 代码实战 1. 点击率预估简介 点击率预估是用来解决什么问题? 点击率预估是对每次广告点击情况作出预测,可以输出点击或者不点击,也可以输出该次点击的概率,后者有时候也称为pClick. 点击率预估模型需要做什么? 通过上述点击率预估的基本概念,我们会发现其实点击率预估问题就是一个二分类的问题,在机器学习中可以使用逻辑回归作为模型的输出,其输出的就是一个概率值,我们可以将机器原创 2020-10-27 23:14:36 · 105 阅读 · 0 评论 -
Task 3 数组操作
数组操作 更改形状 在对数组进行操作时,为了满足格式和计算的要求通常会改变其形状。 numpy.ndarray.shape表示数组的维度,返回一个元组,这个元组的长度就是维度的数目,即 ndim 属性(秩)。 【例】通过修改 shap 属性来改变数组的形状。 import numpy as np x = np.array([1, 2, 9, 4, 5, 6, 7, 8]) print(x.shape) # (8,) x.shape = [2, 4] print(x) # [[1 2 9 4] #原创 2020-10-25 20:45:06 · 72 阅读 · 0 评论 -
Task3 矩阵分解
1. 隐语义模型与矩阵分解 协同过滤算法的特点就是完全没有利用到物品本身或者是用户自身的属性, 仅仅利用了用户与物品的交互信息就可以实现推荐,是一个可解释性很强, 非常直观的模型, 但是也存在一些问题, 第一个就是处理稀疏矩阵的能力比较弱, 所以为了使得协同过滤更好处理稀疏矩阵问题, 增强泛化能力, 从协同过滤中衍生出矩阵分解模型(Matrix Factorization,MF)或者叫隐语义模型, 两者差不多说的一个意思, 就是在协同过滤共现矩阵的基础上, 使用更稠密的隐向量表示用户和物品, 挖掘用户和物原创 2020-10-24 23:28:06 · 228 阅读 · 0 评论 -
Task 2 协同过滤
Task 2 协同过滤 文章目录Task 2 协同过滤1. 协同过滤算法介绍2. 相似度度量方法3. 基于用户的协同过滤(UserCF)4. 基于物品的协同过滤5. 算法评估6. 协同过滤算法的权重改进7. 协同过滤算法的问题分析 1. 协同过滤算法介绍 基本思想:根据用户之前的喜好以及其他兴趣相近的用户的选择来给用户推荐物品(基于对用户历史行为数据的挖掘发现用户的喜好偏向,并预测用户可能喜好的产品进行推荐),一般是仅仅基于用户的行为数据(评价、购买、下载等), 而不依赖于项的任何附加信息(物品自身特征)原创 2020-10-22 15:47:31 · 62 阅读 · 0 评论 -
Task 2 索引、切片和迭代
Task 2 索引、切片和迭代 文章目录Task 2 索引、切片和迭代副本和视图索引与切片1. 整数索引2. 切片索引3. dots索引4. 整数数组索引5. 布尔索引数组迭代练习 副本和视图 在 Numpy 中,尤其是在做数组运算或数组操作时,返回结果不是数组的 副本 就是 视图。 所有赋值运算不会为数组和数组中的任何元素创建副本。 numpy.ndarray.copy() 函数创建一个副本。 对副本数据进行修改,不会影响到原始数据,它们物理内存不在同一位置。 import numpy as np x原创 2020-10-22 13:59:13 · 101 阅读 · 0 评论 -
Task 2 协同过滤
Task 2 协同过滤 文章目录Task 2 协同过滤1. 协同过滤算法介绍2. 相似度度量方法3. 基于用户的协同过滤(UserCF)4. 基于物品的协同过滤5. 算法评估6. 协同过滤算法的权重改进7. 协同过滤算法的问题分析 1. 协同过滤算法介绍 基本思想:根据用户之前的喜好以及其他兴趣相近的用户的选择来给用户推荐物品(基于对用户历史行为数据的挖掘发现用户的喜好偏向,并预测用户可能喜好的产品进行推荐),一般是仅仅基于用户的行为数据(评价、购买、下载等), 而不依赖于项的任何附加信息(物品自身特征)原创 2020-10-20 19:45:43 · 132 阅读 · 1 评论 -
Task 1 推荐系统简介
推荐系统简介 文章目录推荐系统简介推荐系统简介常用评测指标召回1. 召回层在推荐系统架构中的位置及作用2. 多路召回策略3. Embedding召回 推荐系统简介 What 用户:推荐系统是一种帮助用户快速发现有用信息的工具 公司:推荐系统是一种增加公司产品与用户接触,购买等行为概率的工具 Why 用户:在用户需求并不十分明确的情况下进行信息的过滤,与搜索系统相比,推荐系统更多的利用用户的各类历史信息猜测其可能喜欢的内容 公司:解决产品能够最大限度地吸引用户,留存用户,增长用户黏性,提高用户转原创 2020-10-19 19:49:03 · 88 阅读 · 0 评论 -
Task 01 数据类型及数组创建
Task 01 数据类型及数组创建 文章目录Task 01 数据类型及数组创建常量numpy.nannumpy.infnumpy.pinumpy.e数据类型创建数据类型数据类型信息时间日期和时间增量datetime64datetime64 和 timedelta64 运算数组的创建1. 根据现有数据创建ndarray2. 依据 ones 和 zeros 填充方式3. 利用数值范围创建ndarray4. 结构数组的创建数组属性 常量 numpy.nan 表示空值。 nan = NaN = NAN 两个n原创 2020-10-19 15:54:07 · 415 阅读 · 1 评论