自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

帆的博客

小白小白

  • 博客(189)
  • 收藏
  • 关注

原创 设置日志记录(logging)

这段代码用于设置日志记录(logging),以便在训练过程中能够记录和输出相关信息。具体包括设定日志格式、日志级别以及输出一些初始状态信息。

2024-07-23 15:40:56 193

原创 设置CUDA、GPU和分布式训练

这段代码用于设置 CUDA、GPU 和分布式训练。它会根据args的参数来确定使用的设备(CPU 或 GPU),以及是否启用分布式训练。

2024-07-23 15:19:40 218

原创 远程调试 Python 脚本

这段代码用于远程调试 Python 脚本,特别是通过 Visual Studio Code(VS Code)的远程调试功能。它会在指定的服务器 IP 和端口上等待调试器的连接。

2024-07-23 15:13:41 195

原创 随机数种子的作用

设置随机数种子(random seed)的目的是为了确保随机数生成器在每次运行时产生相同的随机数序列,从而保证实验结果的一致性。随机数种子通过初始化随机数生成器的内部状态,使得在相同的种子值下,随机数生成器每次调用时生成的序列是相同的。

2024-07-23 14:36:35 352

原创 深度学习基础代码总结

enumerate 是 Python 的一个内置函数,它允许我们在遍历一个可迭代对象(例如列表)时,同时获取当前元素的索引和元素本身。

2024-07-23 13:57:00 19

原创 SSAN代码解析

函数定义功能: 加载并缓存样本数据。输入args(参数配置),tokenizer(分词器),evaluate(是否评估),predict(是否预测)。输出: 返回构建的TensorDataset对象。处理分布式训练的屏障功能: 确保只有第一个进程处理数据集,其余进程等待使用缓存。初始化处理器和加载标签映射功能: 初始化DocRED处理器并加载标签映射。根据模式加载数据集else:功能: 根据evaluate和predict标志,加载验证集、测试集或训练集的样本。将样本转换为特征。

2024-07-22 23:13:46 20

原创 DocRED数据集

train_distant.json:包含远程监督(distant supervision)数据,可能是未完全标注或自动标注的训练数据,用于增强模型的训练集。load_train_annotated_rel2num.json:包含标注过的训练集关系与数量的映射,可能用于统计训练集中关系的分布。load_train_annotated.json:包含标注过的训练集数据,是训练集中标注了实体和关系的数据。load_test_rel2num.json:包含测试集关系与数量的映射,可能用于统计测试集中关系的分布。

2024-07-22 16:02:36 248

原创 import argparse包总结

【代码】import argparse包总结。

2024-07-21 20:26:21 55

原创 huggingface上的模型权重文件的功能详解

这个文件是tokenizer配置的一部分,定义了这些特殊token的ID及其在文本处理中的具体作用。加载模型时,tokenizer会根据这个文件正确处理这些特殊token。:包含特殊token的映射信息,这些token在自然语言处理任务中有特殊作用。这些文件包含了深度学习模型的各种配置和权重信息,适用于不同的框架和用途。这些文件共同构成了一个完整的深度学习模型的配置和权重,可以在不同的框架中加载和使用这个模型。

2024-07-19 20:02:10 701

原创 运行sh脚本文件常见错误总结

试着运行这个改进后的脚本,看是否还会出现同样的错误。如果有更多的错误信息,请提供详细信息,以便进一步诊断。确保脚本文件没有以Windows换行符(CRLF)结尾,这可能导致问题。

2024-07-19 17:46:27 257

原创 服务器相关总结

查看conda版本查看当前conda的配置文件位置编辑配置文件,默认路径是~/condarc在channels字段添加新的镜像源,例如清华镜像显示所有的channel添加清华镜像源

2024-07-19 17:26:49 371

原创 DocRE-SD代码解析

【代码】DocRE-SD代码解析。

2024-07-18 19:26:52 205

转载 疑难错误(转载)总结

解决Conda报错InvalidArchiveError的几种方法

2024-07-18 16:58:17 9

转载 疑难错误(转载)总结

解决Conda报错InvalidArchiveError的几种方法

2024-07-18 15:18:57 11

原创 Can‘t detach views in-place. Use detach() instead. If you are using DistributedDataParallel (DDP) fo

这个错误信息主要是关于使用 PyTorch 的进行分布式训练时,梯度视图无法就地分离的问题。具体来说,当设置为True时,梯度实际上是 DDP 桶的视图,因此不能直接调用detach_()方法。detach()Truedetach_()一般来说,detach()方法用于创建一个新的张量,该张量与原始计算图分离,而detach_()是一个就地操作。由于在 DDP 模式下,梯度是 DDP 桶的视图,就地操作会影响这些视图,从而引发错误。

2024-07-18 14:01:00 323

原创 Document-level RE中,关键词DocRED,Re-DocRED,Dev,Test,Ign F1,F1分别都是什么意思(附代码)

DocRED是一个广泛使用的文档级关系抽取数据集,用于训练和评估模型在文档级关系抽取任务上的性能。通常指DocRED数据集的修订版,可能包含改进的数据注释或修订的标注以提高数据质量。开发集用于模型调参和验证模型性能,通常不用于最终评估。: Test set。测试集用于评估模型的最终性能,通常在模型训练和调参后使用,且其标签对模型不可见。F1分数的一种变体,计算时忽略某些不确定的预测,例如DocRED中忽略NA (Not Available)类别的预测。: F1 score。

2024-07-17 22:06:43 326

原创 SSLRec代码分析

类,用于使用网格搜索方法进行超参数调优。它遍历超参数值的组合,根据配置构建和训练模型,并管理超参数的配置和记录。

2024-07-14 16:41:14 176

原创 【总结】深度学习的神经网络层(比如Linear层等)介绍

深度学习中的神经网络由多种不同类型的层组成,每种层都有其独特的功能和用途。以下是一些常见的神经网络层的介绍和示例代码,并附带详细的注释。

2024-07-13 11:34:52 352

原创 缺少验证集怎么办

通过这种方式,即使只有训练集和测试集,我们仍然可以通过交叉验证技术来有效地评估和选择模型,尽量减少过拟合的风险。在一些情况下,只有训练集和测试集也是可以的,但是会带来一些问题和挑战。

2024-07-13 11:25:17 358

原创 训练集,验证集,测试集的作用

为什么要分为这三个集?假设我们不分开数据集,将所有数据用于训练,那么模型可能会记住训练数据,而无法泛化到新数据(即过拟合)。验证集和测试集的引入能够帮助我们检测这种情况,并选择或调整模型以提高其泛化能力。训练集 (Training Set), 验证集 (Validation Set) 和测试集 (Test Set) 是机器学习和深度学习模型开发过程中不可或缺的部分。通过这种方式,我们可以确保模型在不同的数据集上有良好的表现,从而提高模型的泛化能力。

2024-07-13 10:58:37 169

原创 深度学习早停(early stop)训练策略

早停(Early Stopping)是一种防止深度学习模型过拟合的正则化技术。在训练过程中,当模型在验证集上的性能不再显著提高时,早停策略会提前停止训练。这样可以避免模型在训练集上表现得越来越好,但在验证集上表现变差。这个PyTorch示例展示了如何实现早停策略,以防止模型过拟合并提高验证集上的性能。以下是一个使用PyTorch实现早停策略的例子,同样使用MNIST手写数字数据集。这个例子演示了如何使用早停策略来防止模型过拟合,从而提高模型在验证集上的性能。

2024-07-13 10:57:50 760

原创 推荐系统数据格式COO Matrix

coo_matrix是一种稀疏矩阵格式,代表在这种格式中,矩阵的非零元素通过行坐标和列坐标存储,因此适用于存储稀疏矩阵(即大部分元素为零的矩阵)。这种格式对于构建稀疏矩阵非常有效,特别是当你知道非零元素的具体位置时。

2024-07-12 22:04:12 315

原创 General CF,Sequential Rec,Social Rec,kg-enhanced Rec,Multi-Behavior Recommendation介绍,并附上代码例子

通用协同过滤利用用户和项目之间的交互数据(如评分、点击等),来预测用户可能喜欢的项目。它主要有两种类型:基于内存的协同过滤(如用户-用户和项目-项目协同过滤)和基于模型的协同过滤(如矩阵分解)。

2024-07-12 17:16:07 604

原创 推荐系统名词解释

特征空间的多层感知识是指通过多个层次或级别的特征提取和理解来增强模型对数据的感知能力。这种方法通常在深度学习中使用,其中神经网络的每一层都可以学习和提取数据的不同层次的特征。这使得模型能够从低层次的简单特征(如边缘、颜色)逐步抽象到高层次的复杂特征(如物体、场景)。假设我们有一个图像分类任务,目标是识别图像中的对象。通过这种多层次的特征提取,模型可以逐步感知和理解图像中的复杂结构和模式,从而提高分类性能。通过这种方式,我们可以实现特征空间的多层感知识,使模型能够更好地理解和处理复杂的输入数据。

2024-07-12 10:29:22 418

原创 用户特征和embedding层做Concatenation

要将用户特征与嵌入层进行连接,可以使用深度学习框架(如TensorFlow或PyTorch)中的基本操作。以下是使用PyTorch的示例代码,展示了如何将用户特征与嵌入层连接起来。

2024-07-09 21:22:10 202

原创 推荐系统中item profiles和user profiles分别是什么

推荐系统中的和是指分别对物品和用户的特征描述。这些特征描述用于计算推荐分数,从而向用户推荐最合适的物品。

2024-07-09 16:31:21 145

原创 【思路】使用大语言模型优化推荐系统的过程推理(process reasoning)

在推荐系统中,过程推理是指理解和解释达到某个推荐结果所采取的步骤。这有助于减轻幻觉(生成不正确或无意义的推荐)问题,并提高输出结果的整体质量和透明度。

2024-07-08 19:10:14 284

原创 推荐系统中Prior Belief的概念(附代码)

先验信念是我们在模型训练之前对参数或变量的预期。这种信念通常基于历史经验、领域知识或专家意见,在贝叶斯统计中尤为重要。

2024-07-07 20:36:27 682

原创 仿写Spring IOC

本来Dao层注入到service层是需要new的,我们在两者中间插入一个工厂类,工厂类里写个方法getDao获取Dao对象(Dao对象即为Dao接口类,它的实现写到DaoImpl里)

2024-07-07 14:09:25 426

原创 Spring IOC基于XML和注解管理Bean

IoC 是 Inversion of Control 的简写,译为“ 控制反转 ”,它不是一门技术,而是一种设计思想,是一个重要的面向对象编程法则,能够指导我们如何设计出 松耦合、更优良的程序。Spring 通过 IoC 容器来管理所有 Java 对象的实例化和初始化,控制对象与对象之间的依赖关系。将由 IoC 容器管理的 Java 对象称为 Spring Bean,它与使用关键字 new 创建的 Java 对象没有任何区别。

2024-07-07 14:08:52 928

原创 IOC控制反转

控制反转,把对象创建和对象之间的调用过程,交给 Spring 进行管理 使用 IOC目的:为了耦合度降低IOC 思想基于 IOC 容器完成,IOC 容器底层就是对象工厂。

2024-07-07 14:07:04 406

原创 多线程详解

文章目录多线程创建方式p3一些教程狂神说多线程创建方式p3代码:package com.demo1;//创建线程方式一:继承Thread类,重写run()方法,调用start开启线程/** * 总结:注意,线程开启不一定立即执行,dCPU调度执行 */public class TestThread1 extends Thread{ @Override public void run(){ //run方法线程体 for (int i =

2024-07-07 14:06:50 171

原创 深度学习与CV入门

文章目录前言历史前言历史tensorflow可以安装Tensorboard第三方库用于展示效果TensorFlow工作流程:p6-4:20使用tf.data加载数据。使用tf.data实例化读取训练数据和测试数据模型的建立与调试:使用动态图模式Eager Execution和著名的神经网络高层API框架Keras,结合可视化工具TensorBoard,简易、快速地建立和调试模型;模型的训练:支持CPU/GPU/单机多卡GPU/多机集群/TPU训练模型,充分利用海量数据和计算资源

2024-07-07 14:06:21 329 2

原创 B样条总结篇

文章目录[曲线篇:深刻理解B 样条曲线(上)](https://www.zhihu.com/tardis/sogou/art/139759835)计算机图形学bezier曲线曲面B样条曲线曲面曲线篇:深刻理解B 样条曲线(上)B样条是贝塞尔曲线的延申,贝塞尔曲线是B样条的基础, B样条可以看成很多组贝塞尔曲线的拼接。B样条的两个性质就是贝塞尔的缺点反过来:1 可以指定阶次。2 移动控制点仅仅改变曲线的部分形状,而不改变整体B样条采用解决方案是贝塞尔曲线的拼接,也就是把一条曲线变为多段贝塞尔曲线的拼

2024-07-07 14:05:51 137

原创 深度学习(卷积网络、循环神经网络、对抗神经网络、Tensorflow实战)

b站视频文章目录机器学习常规套路k近邻k近邻计算流程练手的的数据集:CIFAR-10k近邻算法求上边图的差异【补充】机器学习常规套路k近邻k近邻计算流程对于未知类别属性数据集中的点:计算已知类别数据集中的点与当前点的距离按照距离依次排序选取与当前点距离最小的K个点确定前K个点所在类别的出现概率返回前K个点出现频率最高的类别作为当前点预测分类。练手的的数据集:CIFAR-10k近邻算法求上边图的差异k-近邻损失函数目的是通过不断的训练,使这个值变得越来越小【补充】1

2024-07-07 14:05:05 233 2

原创 【python教程】数据分析——numpy、pandas、matplotlib

【python教程】数据分析——numpy、pandas、matplotlib文章目录什么是matplotlib安装matplotlib,画个折线什么是matplotlibmatplotlib:最流行的Python底层绘图库,主要做数据可视化图表,名字取材于MATLAB,模仿MATLAB构建安装matplotlib,画个折线直接在pytorch环境下输入:pip install matplotlib -i http://mirrors.aliyun.com/pypi/simple/ --t

2024-07-07 14:04:45 143 2

原创 计算机图形学bezier曲线曲面B样条曲线曲面

b站视频文章目录曲线曲面基本理论曲线(面)参数表示1、显示、隐式和参数表示2、显式或隐式表示存在的问题3、参数方程曲线曲面基本理论计算机图形学三大块内容:光栅图形显示、几何造型技术、真实感图形显示。光栅图形学是图形学的基础,有大量的思想和算法几何造型技术是一项研究在计算机中,如何表达物体模型形状的技术描述物体的三维模型有三种:线框模型、曲面模型和实体模型线框模型用顶点和棱边来表示物体曲面模型只描述物体的表面和表面的连接关系(拓普关系),不描述物体内部的点的属性实体模型不但有物体的外观而且也

2024-07-07 14:04:16 429 2

原创 Linux服务器使用总结-不定时更新

【代码】Linux服务器使用总结-不定时更新。

2024-07-07 14:03:05 108

原创 推荐系统协作端表示和文本端表示

协作端表示是基于用户行为数据(如用户的评分、购买历史、浏览记录等)来表示用户和项目(物品)。它依赖于用户之间的相似性和物品之间的相似性来进行推荐。

2024-07-07 13:47:37 286

原创 推荐系统数据集——Amazon-Book

在推荐系统中,像Amazon-Book这样的数据集通常包含用户和物品的交互信息。为了训练模型,这些数据需要转换成适合模型输入的格式。在这种情况下,item_list和user_list需要转换成train.txt文件,通常包含用户ID和物品ID的交互记录。train.txt。

2024-06-27 09:46:49 418

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除