19期推荐系统实践学习(五)

排序模型
通过召回的操作, 已经进行了问题规模的缩减, 对于每个用户, 选择出了N篇文章作为了候选集,并基于召回的候选集构建了与用户历史相关的特征,以及用户本身的属性特征,文章本身的属性特征,以及用户与文章之间的特征,下面就是使用机器学习模型来对构造好的特征进行学习,然后对测试集进行预测,得到测试集中的每个候选集用户点击的概率,返回点击概率最大的topk个文章,作为最终的结果。

排序阶段选择了三个比较有代表性的排序模型,它们分别是:

  • LGB的排序模型
  • LGB的分类模型
  • 深度学习的分类模型DIN

得到了最终的排序模型输出的结果之后,还选择了两种比较经典的模型集成的方法:

  • 输出结果加权融合
  • Staking(将模型的输出结果再使用一个简单模型进行预测)

LGB的排序模型简介 :
参考链接:
https://blog.csdn.net/demm868/article/details/103485658
https://mp.weixin.qq.com/s/jzsQqhkkYDY8Yiyu2VAwsg
下面是LGB的排序模型的主要介绍:

一、为什么需要使用机器学习的方法来进行排序
排序(Ranking)一直是信息检索的核心研究问题,有大量的成熟的方法,主要可以分为以下两类:相关度排序模型和重要性排序模型。

  • 相关度排序模型(Relevance Ranking
    Model):根据查询和文档之间的相似度来对文档进行排序。常用的模型包括:布尔模型(Boolean
    Model),向量空间模型(Vector Space Model),隐语义分析(Latent Semantic
    Analysis),BM25,LMIR模型等等。

  • 重要性排序模型(Importance Ranking Model):不考虑查询,而仅仅根据网页(亦即文档)之间的图结构来判断文档的权威程度,典型的权威网站包括Google,Yahoo!等。常用的模型包括PageRank,HITS,HillTop,TrustRank等等。

    对于传统的排序模型,单个模型往往只能考虑某一个方面(相关度或者重要性),所以只是用单个模型达不到要求。搜索引擎通常会组合多种排序模型来进行排序,但是,如何组合多个排序模型来形成一个新的排序模型,以及如何调节这些参数,都是一个很大的问题。

    使用机器学习的方法,我们可以把各个现有排序模型的输出作为特征,然后训练一个新的模型,并自动学得这个新的模型的参数,从而很方便的可以组合多个现有的排序模型来生成新的排序模型。
    Learning to Rank :用机器学习方法解决排序问题的方法称为LTR(Learning to Ranking)。与文本分类不同,L2R考虑的是给定查询的文档集合的排序。所以,L2R用到的特征不仅仅包含文档d本身的一些特征(比如是否是Spam)等,也包括文档d和给定查询q之间的相关度,以及文档在整个网络上的重要性(比如PageRank值等),亦即我们可以使用相关性排序模型和重要性排序模型的输出来作为L2R的特征。
    二、L2R训练数据的获取
    L2R的训练数据可以有三种形式:对于每个查询,各个文档的绝对相关值(非常相关,比较相关,不相关,等等);对于每个查询,两两文档之间的相对相关值(文档1比文档2相关,文档4比文档3相关,等等);对于每个查询,所有文档的按相关度排序的列表(文档1>文档2>文档3)。这三种形式的训练数据之间可以相互转换。

训练数据的获取有两种主要方法:人工标注和从日志文件中挖掘。
三、L2R模型训练
L2R是一个有监督学习过程。对与每个给定的查询-文档对(query document pair),抽取相应的特征(既包括查询和文档之间的各种相关度,也包括文档本身的特征以及重要性等),另外通过或者人工标注或者从日志中挖掘的方法来得到给定查询下文档集合的真实序列。然后我们使用L2R的各种算法来学到一个排序模型,使其输出的文档序列和真实序列尽可能相似。
L2R算法主要包括三种类别:PointWise,PairWise,ListWise。
排序系统的工作示意图如下:
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
基于深度学习的病虫害识别系统是一种利用深度神经网络技术来帮助农作物病虫害的自动识别和分类的系统。它基于图像,使用深度学习网络对植物的病虫害进行分类和判别。通过对植物图像数据集进行深度特征提取和迁移学习系统可以准确地识别出不同类型的病虫害。 这种系统的实现通常包括以下步骤:首先,使用大量的植物病虫害图像数据集训练深度学习网络,如AlexNet、VGG16、VGG19、GoogleNet、ResNet50、ResNet101、InceptionV3、InceptionResNetV2和SqueezeNet。然后,利用深度特征提取技术从这些训练好的网络中提取特征。接下来,使用支持向量机(SVM)、极限学习机(ELM)或k最近邻(KNN)等分类算法对提取到的特征进行分类和识别。最后,通过微调预训练的深度学习模型,将其应用于具体的病虫害检测中。 这种基于深度学习的病虫害识别系统的主要优点是能够在较高的准确度和效率下自动识别和分类不同类型的病虫害。它可以帮助农民和农业专家快速检测和诊断植物的健康状况,及时采取相应的防治措施,减少病虫害对农作物产量和质量的影响。 引用<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [基于深度学习的农作物病虫害识别系统](https://blog.csdn.net/qq_42135426/article/details/128499822)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值