自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 算法工程师-推荐系统(4)

4 协同过滤-基于行为相似的召回4.1

2020-12-22 21:13:33 255 1

原创 算法工程师-推荐系统(3)

3 推荐算法工具3.1 主流推荐系统平台在机器学习工具中,常用的主流机器学习平台有Sklearn、Spark、TensorFlow;在效率工具Notebook中,常用的主流工具包括Zeppelin Notebook和Jupyter Notebook。3.1.1 sklearn机器学习库在此可以看到库的算法主要有4类:分类、回归、聚类和降维。● 常用的回归算法:线性、决策树、SVM、KNN;集成回归算法:随机森林、AdaBoost、GradientBoosting、Bagging、ExtraT

2020-12-18 22:01:51 189 1

原创 算法工程师-推荐系统(2)

2 推荐系统介绍2.1 推荐系统历史1994年,协同过滤被提出,也是最早的自动化协同过滤推荐系统1997年,推荐系统这个词被使用2.2 原理推荐引擎与传统搜索引擎不一样的地方就是,用户其实并不清楚自己的需求,或者他们的需求很难用简单的关键词来表述,又或者他们需要更加符合自身口味和喜好的结果,因此就出现了基于用户需求、口味、喜好的信息发现机制的推荐系统。2.2.1 简单推荐系统元素最简单的推荐系统流程如图所示,构成推荐系统的主要元素如下。● 物品集合:要推荐物品或内容,例如商品、音乐、

2020-12-18 21:35:22 206 1

原创 算法工程师-推荐系统(1)

1 第一章-数学基础1.1 评价指标1.1.1 混淆矩阵混淆矩阵(Confusion Matrix)是可视化方法,属于监督学习。其主要用于比较分类结果和实际预测值,并可以把分类结果的精度显示在一个混淆矩阵中。混淆矩阵是除ROC曲线和AUC之外的另一个判断分类好坏程度的方法,矩阵的每一行则表达了版本所属的真实类别。● 真正类(True Positive,简称TP):实例是正类并且被预测成正类。● 假正类(False Positive,简称FP):实例是负类并且被预测成正类。● 真负类(True N

2020-12-18 20:18:05 165

原创 python-opencv图像处理--阈值处理

python-opencv图像处理5 阈值处理5.1 threshold函数retval, dst = cv2.threshold(img, thresh, maxval, type)参数及返回值retval代表返回的阈值dst代表阈值分割结果图像,与原始图像具有相同的大小和类型。src代表要进行阈值分割的图像,可以是多通道的,8位或32位浮点型数值。thresh代表要设定的阈值。maxval代表当type参数为THRESH_BINARY或者THRESH_BINARY_INV类型时,需

2020-12-17 19:23:25 587

原创 算法工程师-机器学习-分类回归模型面试常见题

title: 机器学习模型优缺点tags: 机器学习,分类,回归grammar_cjkRuby: true1 机器学习分类模型1.1 朴素贝叶斯的优缺点 NBM原理及推导参考来源https://www.cnblogs.com/jpcflyer/p/11069659.htmlhttps://zhuanlan.zhihu.com/p/262621511.1.1 优点算法逻辑简单,易于实现分类过程中时空开销小对缺失数据不太敏感,适合文本分类对小规模的数据表现很好,能个处理多分类任务.

2020-11-11 14:29:42 1870

原创 算法工程师-机器学习模型(处理缺失值)

title: 机器学习模型–处理缺失值tags: python,机器学习grammar_cjkRuby: true现实生活中的数据集中的样本通常在某系属性上是缺失的,如果属性值缺失的样本数量比较少,我们可以直接简单粗暴的把不完备的样本删除掉,但是如果有大量的样本都有属性值的缺失,那么就不能简单地删除,因为这样删除了大量的样本,对于机器学习模型而言损失了大量有用的信息,训练出来的模型性能会受到影响。数据集如下(数据集来自周志华《机器学习》)1. 决策树处理缺失值参考来源:http://blog..

2020-11-11 10:15:48 982

原创 算法工程师-机器学习集成学习

集成学习集成算法 = 多个学习器 + 结合策略——>强学习器。单个学习器难以平衡准确性(拟合能力),和多样性(泛化能力)。通过集成可以尽量平衡这两者的关系。如果多个学习器是一样的,如都是决策树,该集成就是同质集成,否者就是异质集成。同质集成中,每个单学习器称为弱学习器,如果若学习器之间的产生没有关系,可以并行实现,就是Bagging,如果弱学习器之间存在强依赖关系,就需要串行实现,如Boosting1. 方差和偏差对于特定的带有真实结果y的数据集D,每个模型的训练结果为 f(X;D),预测

2020-11-10 20:31:10 375

原创 算法图像岗-图像分类与图像分割

1 神经网络各种技巧第一次使用relu Alexnetdropout Alexnet重叠的池化 Alexnet卷积堆叠(5 * 5 = 3 * 3) VGG第一次使用1 * 1卷积 VGG16(中使用了1 * 1卷积,通道数不变)加深网络结构可以提升性能 VGG1 * 1降维 inceptionV1模型融合 inceptionV1辅助分类节点:inceptionV1不在存在5 * 5以上的卷积:inceptionV2深度可分离卷积:inceptionV2BN的使用:incepti

2020-11-08 14:13:41 1677 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除