算法工程师面试
下一份守候
日光之下,并无新事
展开
-
算法工程师-推荐系统(4)
4 协同过滤-基于行为相似的召回4.1原创 2020-12-22 21:13:33 · 255 阅读 · 1 评论 -
算法工程师-推荐系统(3)
3 推荐算法工具3.1 主流推荐系统平台在机器学习工具中,常用的主流机器学习平台有Sklearn、Spark、TensorFlow;在效率工具Notebook中,常用的主流工具包括Zeppelin Notebook和Jupyter Notebook。3.1.1 sklearn机器学习库在此可以看到库的算法主要有4类:分类、回归、聚类和降维。● 常用的回归算法:线性、决策树、SVM、KNN;集成回归算法:随机森林、AdaBoost、GradientBoosting、Bagging、ExtraT原创 2020-12-18 22:01:51 · 188 阅读 · 1 评论 -
算法工程师-推荐系统(2)
2 推荐系统介绍2.1 推荐系统历史1994年,协同过滤被提出,也是最早的自动化协同过滤推荐系统1997年,推荐系统这个词被使用2.2 原理推荐引擎与传统搜索引擎不一样的地方就是,用户其实并不清楚自己的需求,或者他们的需求很难用简单的关键词来表述,又或者他们需要更加符合自身口味和喜好的结果,因此就出现了基于用户需求、口味、喜好的信息发现机制的推荐系统。2.2.1 简单推荐系统元素最简单的推荐系统流程如图所示,构成推荐系统的主要元素如下。● 物品集合:要推荐物品或内容,例如商品、音乐、原创 2020-12-18 21:35:22 · 205 阅读 · 1 评论 -
算法工程师-推荐系统(1)
1 第一章-数学基础1.1 评价指标1.1.1 混淆矩阵混淆矩阵(Confusion Matrix)是可视化方法,属于监督学习。其主要用于比较分类结果和实际预测值,并可以把分类结果的精度显示在一个混淆矩阵中。混淆矩阵是除ROC曲线和AUC之外的另一个判断分类好坏程度的方法,矩阵的每一行则表达了版本所属的真实类别。● 真正类(True Positive,简称TP):实例是正类并且被预测成正类。● 假正类(False Positive,简称FP):实例是负类并且被预测成正类。● 真负类(True N原创 2020-12-18 20:18:05 · 165 阅读 · 0 评论 -
算法工程师-机器学习集成学习
集成学习集成算法 = 多个学习器 + 结合策略——>强学习器。单个学习器难以平衡准确性(拟合能力),和多样性(泛化能力)。通过集成可以尽量平衡这两者的关系。如果多个学习器是一样的,如都是决策树,该集成就是同质集成,否者就是异质集成。同质集成中,每个单学习器称为弱学习器,如果若学习器之间的产生没有关系,可以并行实现,就是Bagging,如果弱学习器之间存在强依赖关系,就需要串行实现,如Boosting1. 方差和偏差对于特定的带有真实结果y的数据集D,每个模型的训练结果为 f(X;D),预测原创 2020-11-10 20:31:10 · 373 阅读 · 0 评论 -
算法工程师-机器学习模型(处理缺失值)
title: 机器学习模型–处理缺失值tags: python,机器学习grammar_cjkRuby: true现实生活中的数据集中的样本通常在某系属性上是缺失的,如果属性值缺失的样本数量比较少,我们可以直接简单粗暴的把不完备的样本删除掉,但是如果有大量的样本都有属性值的缺失,那么就不能简单地删除,因为这样删除了大量的样本,对于机器学习模型而言损失了大量有用的信息,训练出来的模型性能会受到影响。数据集如下(数据集来自周志华《机器学习》)1. 决策树处理缺失值参考来源:http://blog..原创 2020-11-11 10:15:48 · 974 阅读 · 0 评论 -
算法工程师-机器学习-分类回归模型面试常见题
title: 机器学习模型优缺点tags: 机器学习,分类,回归grammar_cjkRuby: true1 机器学习分类模型1.1 朴素贝叶斯的优缺点 NBM原理及推导参考来源https://www.cnblogs.com/jpcflyer/p/11069659.htmlhttps://zhuanlan.zhihu.com/p/262621511.1.1 优点算法逻辑简单,易于实现分类过程中时空开销小对缺失数据不太敏感,适合文本分类对小规模的数据表现很好,能个处理多分类任务.原创 2020-11-11 14:29:42 · 1852 阅读 · 0 评论