大模型与推荐系统
文章平均质量分 69
大模型与推荐系统
挨打且不服66
计算机博士,推荐系统
展开
-
huggingface上的模型权重文件的功能详解
这个文件是tokenizer配置的一部分,定义了这些特殊token的ID及其在文本处理中的具体作用。加载模型时,tokenizer会根据这个文件正确处理这些特殊token。:包含特殊token的映射信息,这些token在自然语言处理任务中有特殊作用。这些文件包含了深度学习模型的各种配置和权重信息,适用于不同的框架和用途。这些文件共同构成了一个完整的深度学习模型的配置和权重,可以在不同的框架中加载和使用这个模型。原创 2024-07-19 20:02:10 · 972 阅读 · 0 评论 -
【总结】深度学习的神经网络层(比如Linear层等)介绍
深度学习中的神经网络由多种不同类型的层组成,每种层都有其独特的功能和用途。以下是一些常见的神经网络层的介绍和示例代码,并附带详细的注释。原创 2024-07-13 11:34:52 · 648 阅读 · 0 评论 -
训练集,验证集,测试集的作用
为什么要分为这三个集?假设我们不分开数据集,将所有数据用于训练,那么模型可能会记住训练数据,而无法泛化到新数据(即过拟合)。验证集和测试集的引入能够帮助我们检测这种情况,并选择或调整模型以提高其泛化能力。训练集 (Training Set), 验证集 (Validation Set) 和测试集 (Test Set) 是机器学习和深度学习模型开发过程中不可或缺的部分。通过这种方式,我们可以确保模型在不同的数据集上有良好的表现,从而提高模型的泛化能力。原创 2024-07-13 10:58:37 · 363 阅读 · 0 评论 -
深度学习早停(early stop)训练策略
早停(Early Stopping)是一种防止深度学习模型过拟合的正则化技术。在训练过程中,当模型在验证集上的性能不再显著提高时,早停策略会提前停止训练。这样可以避免模型在训练集上表现得越来越好,但在验证集上表现变差。这个PyTorch示例展示了如何实现早停策略,以防止模型过拟合并提高验证集上的性能。以下是一个使用PyTorch实现早停策略的例子,同样使用MNIST手写数字数据集。这个例子演示了如何使用早停策略来防止模型过拟合,从而提高模型在验证集上的性能。原创 2024-07-13 10:57:50 · 1090 阅读 · 0 评论 -
推荐系统数据格式COO Matrix
coo_matrix是一种稀疏矩阵格式,代表在这种格式中,矩阵的非零元素通过行坐标和列坐标存储,因此适用于存储稀疏矩阵(即大部分元素为零的矩阵)。这种格式对于构建稀疏矩阵非常有效,特别是当你知道非零元素的具体位置时。原创 2024-07-12 22:04:12 · 375 阅读 · 0 评论 -
General CF,Sequential Rec,Social Rec,kg-enhanced Rec,Multi-Behavior Recommendation介绍,并附上代码例子
通用协同过滤利用用户和项目之间的交互数据(如评分、点击等),来预测用户可能喜欢的项目。它主要有两种类型:基于内存的协同过滤(如用户-用户和项目-项目协同过滤)和基于模型的协同过滤(如矩阵分解)。原创 2024-07-12 17:16:07 · 649 阅读 · 0 评论 -
推荐系统名词解释
特征空间的多层感知识是指通过多个层次或级别的特征提取和理解来增强模型对数据的感知能力。这种方法通常在深度学习中使用,其中神经网络的每一层都可以学习和提取数据的不同层次的特征。这使得模型能够从低层次的简单特征(如边缘、颜色)逐步抽象到高层次的复杂特征(如物体、场景)。假设我们有一个图像分类任务,目标是识别图像中的对象。通过这种多层次的特征提取,模型可以逐步感知和理解图像中的复杂结构和模式,从而提高分类性能。通过这种方式,我们可以实现特征空间的多层感知识,使模型能够更好地理解和处理复杂的输入数据。原创 2024-07-12 10:29:22 · 455 阅读 · 0 评论 -
用户特征和embedding层做Concatenation
要将用户特征与嵌入层进行连接,可以使用深度学习框架(如TensorFlow或PyTorch)中的基本操作。以下是使用PyTorch的示例代码,展示了如何将用户特征与嵌入层连接起来。原创 2024-07-09 21:22:10 · 246 阅读 · 0 评论 -
推荐系统中item profiles和user profiles分别是什么
推荐系统中的和是指分别对物品和用户的特征描述。这些特征描述用于计算推荐分数,从而向用户推荐最合适的物品。原创 2024-07-09 16:31:21 · 190 阅读 · 0 评论 -
【思路】使用大语言模型优化推荐系统的过程推理(process reasoning)
在推荐系统中,过程推理是指理解和解释达到某个推荐结果所采取的步骤。这有助于减轻幻觉(生成不正确或无意义的推荐)问题,并提高输出结果的整体质量和透明度。原创 2024-07-08 19:10:14 · 332 阅读 · 0 评论 -
推荐系统中Prior Belief的概念(附代码)
先验信念是我们在模型训练之前对参数或变量的预期。这种信念通常基于历史经验、领域知识或专家意见,在贝叶斯统计中尤为重要。原创 2024-07-07 20:36:27 · 738 阅读 · 0 评论 -
推荐系统协作端表示和文本端表示
协作端表示是基于用户行为数据(如用户的评分、购买历史、浏览记录等)来表示用户和项目(物品)。它依赖于用户之间的相似性和物品之间的相似性来进行推荐。原创 2024-07-07 13:47:37 · 307 阅读 · 0 评论 -
推荐系统数据集——Amazon-Book
在推荐系统中,像Amazon-Book这样的数据集通常包含用户和物品的交互信息。为了训练模型,这些数据需要转换成适合模型输入的格式。在这种情况下,item_list和user_list需要转换成train.txt文件,通常包含用户ID和物品ID的交互记录。train.txt。原创 2024-06-27 09:46:49 · 777 阅读 · 0 评论 -
大模型中的Lang chain是什么意思
LangChain 是一个开源框架,旨在简化构建和操作由大型语言模型 (LLMs) 驱动的应用程序。它提供了一套工具和抽象,帮助开发者将多个语言模型集成到应用程序中,并简化了模型的管理、交互和扩展。原创 2024-06-24 13:42:41 · 395 阅读 · 0 评论