工业界真实的推荐系统(小红书)-排序:精排(模型、特征、融分公式、数据服务)、粗排(三塔模型)

课程特点:系统、清晰、实用,原理和落地经验兼具
b站:https://www.bilibili.com/video/BV1HZ421U77y/?spm_id_from=333.337.search-card.all.click&vd_source=b60d8ab7e659b10ea6ea743ede0c5b48
讲义:https://github.com/wangshusen/RecommenderSystem

王树森老师的硬核课程,由于PPT很多,并且老师的很多经验是口述,没有写在PPT里,网上有一些网友的笔记,但不是很完整,学习起来也比较费事,所以我自己整理了120页的PPT(这里放的是截图),期望能比较完整地把老师的经验呈现出来,同时缩短学习时间

【1】工业界真实的推荐系统-小红书(王树森)
【2】工业界真实的推荐系统(小红书)-召回-ItemCF、Swing、UserCF
【3】工业界真实的推荐系统(小红书)-离散特征处理、矩阵补充模型、双塔模型
【4】工业界真实的推荐系统(小红书)-召回-改进双塔模型-自监督学习
【5】工业界真实的推荐系统(小红书)-小红书用到的其他召回通道、曝光过滤 & bloom filter
【6】工业界真实的推荐系统(小红书)-排序:精排(模型、特征、融分公式、数据服务)、粗排(三塔模型)
【7】工业界真实的推荐系统(小红书)-特征交叉:FM、DCN、LHUC、SENet、FiBiNet
【8】工业界真实的推荐系统(小红书)-用户行为序列建模:LastN、DIN、SIM
【9】工业界真实的推荐系统(小红书)-重排:多样性算法-MMR、DPP、结合业务规则
【10】工业界真实的推荐系统(小红书)-AB测试:分层、Holdout机制、反转实验
【11】工业界真实的推荐系统(小红书)-物品冷启动:全链路优化、流量调控(提权、保量、差异化保量)
【12】工业界真实的推荐系统(小红书)-物品冷启动的AB测试
【13】工业界真实的推荐系统(小红书)-涨指标的方法:召回、排序、多样性、特殊人群、利用交互行为

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 7
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
下面是一个工业级NLP项目开发中的方法模板,包含了数据预处理、词语处理、数据增强、实体识别、向量化和序列化等方法,并对每行代码进行了注解: ```python class DataPreprocess: def __init__(self, rawData): self.rawData = rawData self.tokenizedData = None self.processedWords = None def tokenize(self): # 实现文本的分词操作,将原始数据切分成词语列表 self.tokenizedData = tokenize(self.rawData) def processWords(self): # 对分词后的数据进行相关处理,如去除停用词、词干提取等 self.processedWords = process_words(self.tokenizedData) class DataAugmentation: def __init__(self, rawData): self.rawData = rawData self.augmentedData = None def augment(self): # 对原始数据进行扩增操作,生成更多样本 self.augmentedData = augment_data(self.rawData) class NamedEntityRecognition: def __init__(self, rawData): self.rawData = rawData self.namedEntities = None def recognizeNamedEntities(self): # 识别文本中的实体,将实体信息存储到namedEntities属性中 self.namedEntities = recognize_entities(self.rawData) class Vectorization: def __init__(self, processedWords): self.processedWords = processedWords self.vectorizedData = None def vectorize(self): # 将经过词语处理后的数据转换为向量表示 self.vectorizedData = vectorize_data(self.processedWords) class Serialization: def __init__(self, rawData): self.rawData = rawData self.serializedData = None def serialize(self): # 将数据保存到磁盘或其他存储介质中 self.serializedData = serialize_data(self.rawData) ``` 以上是一个简化的示例,你可以根据具体的需求和项目来实现每个方法。在实际的工业级NLP项目开发中,这些方法可能会更加复杂和完善,涉及到更多的数据处理、模型训练和评估等步骤。 希望这个示例对你有帮助!如果还有其他问题,请随时提问。祝你在学习NLP的道路上取得进步!加油!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值