python
文章平均质量分 61
python相关
挨打且不服66
计算机博士,推荐系统
展开
-
liunx运行脚本文件sh,和window运行脚本文件命令及注意事项总结
Windows Subsystem for Linux (WSL) 允许你在Windows上运行Linux环境。脚本文件是用于在类Unix操作系统(如Linux和macOS)中运行的Shell脚本。在Windows中,你可以使用一些工具和环境来运行这些脚本。无论是通过WSL、Git Bash、Cygwin,还是直接使用PowerShell调用WSL,你都可以方便地执行这些脚本。Git Bash 是一个用于Windows的应用程序,提供了一个类似于Linux的命令行环境,可以运行。原创 2024-08-05 14:37:56 · 958 阅读 · 0 评论 -
什么情况下跑代码内存才会爆
当出现内存溢出时,首先要检查代码中的数据大小、模型结构、循环处理等部分,并优化批处理大小、使用生成器、减少不必要的内存拷贝或清理无用的变量。合理使用工具如psutil和来监控内存使用情况,也可以帮助预防内存爆掉的情况。原创 2024-08-04 20:51:00 · 445 阅读 · 0 评论 -
常见深度学习优化器总结
AdamW和Lookahead是非常值得尝试的选择,特别是在你希望获得更好的泛化能力时。适合在需要更强正则化的场景下使用。RAdam则在初期训练稳定性上有所提升。在切换优化器的同时,你也可以尝试调整学习率和正则化系数等超参数,以进一步提升模型的性能。原创 2024-08-04 12:14:21 · 502 阅读 · 0 评论 -
conda更换环境版本(比如torch版本)
找到想要的torch版本创建新环境。原创 2024-08-03 10:41:39 · 701 阅读 · 0 评论 -
torch-sparse安装教程(转载)
torch_geometric、 torch_sparse、 torch_scatter、 torch_cluster是一个大佬根据根据pytorch版本和一些bug修复持续更新的,因此依赖关系比较严重,根据发布的版本应该对应起来进行安装使用。这些是有版本区别的,对应不同的torch版本。转载 2024-08-02 10:56:28 · 111 阅读 · 0 评论 -
conda操作总结,pip操作总结,python包安装
【代码】conda操作总结。原创 2024-08-01 22:42:12 · 485 阅读 · 0 评论 -
conda 安装和wheel安装什么区别
Conda: 适用于需要多语言包管理、完整环境管理和自动解决依赖关系的场景。适合于数据科学、机器学习等需要多个语言包和环境管理的项目。: 适用于纯 Python 项目,专注于快速安装和管理 Python 包。适合于简单的 Python 项目,尤其是当你只需要管理 Python 包时。选择conda还是pip(wheel)取决于你的具体需求和项目复杂度。对于复杂的多语言项目或需要强大的环境管理功能时,conda是更好的选择;对于简单的 Python 项目,pip(wheel) 更加轻量且易于使用。原创 2024-08-01 17:42:27 · 657 阅读 · 0 评论 -
运行脚本文件是bash和sh的区别
bash和shshbashshbash[[ ]]<()**shbashshbashshshshbashbashbashshshshbashshbashshbash。原创 2024-08-01 16:56:06 · 605 阅读 · 0 评论 -
遇见过的python包总结
dreeam:ipdb:opt_einsum:ujson:原创 2024-08-01 15:59:18 · 438 阅读 · 0 评论 -
wget命令是干嘛的,怎么用
尽管wget是一个强大的下载工具,但在 Python 脚本中通常使用subprocess模块来调用它。如果不想依赖外部工具,可以使用requests模块来实现类似的功能。两种方法各有优劣,可以根据具体需求选择合适的方式。原创 2024-07-31 20:08:41 · 690 阅读 · 0 评论 -
QLoRA是干嘛的
在文档级关系抽取任务中,QLoRA(Quantized Low-Rank Adaptation)是一种用于优化和加速深度学习模型的方法,尤其在大规模语言模型的微调(fine-tuning)过程中。QLoRA通过将模型的权重进行量化和低秩分解,从而降低计算和存储的需求,同时保持模型性能。原创 2024-07-31 11:02:44 · 521 阅读 · 0 评论 -
深度学习网络相关代码(持续更新)
sigmoid 函数将其输入的每个元素映射到 0 和 1 之间。因此,结果数组中的每个值都被归一化到了这个范围内。这个特性使得 sigmoid 函数常用于需要输出概率值或在 0 和 1 之间进行归一化的情况。会对输入的每个元素进行操作,返回一个与输入形状相同的 tensor,其中每个元素都是对应的 sigmoid 值。库:datasets。原创 2024-07-28 19:04:47 · 227 阅读 · 0 评论 -
安装python包,github,本地,requirements.txt等
命令克隆仓库,或者直接从 GitHub 网站下载 ZIP 文件并解压缩。有些项目可能有特定的安装步骤。在开始安装之前,最好检查一下项目的。文件或其他文档,以确保没有遗漏任何特定的安装指引。希望这些步骤对你有帮助!如果有任何问题,请随时提问。或者,如果你希望在开发过程中进行调试,可以使用。文件,用于列出项目的依赖项。文件来管理构建配置,你可以使用。在仓库目录中通常有一个。另一种常见的方法是使用。原创 2024-07-27 16:39:37 · 489 阅读 · 0 评论 -
设置混合精度训练(fp16),减少 GPU 内存使用并加快训练速度
这些参数用于启用和配置混合精度训练,能够显著减少 GPU 内存使用并加快训练速度。使用这些参数时,请确保你已经安装了 NVIDIA Apex 库,并在训练代码中正确初始化 AMP。原创 2024-07-27 14:03:22 · 571 阅读 · 0 评论 -
Tensor内存布局问题,view,reshape的优缺点
在你的情况下,当你对logits和label进行view操作时,可能会因为这些张量是非连续的而导致错误。使用reshape操作可以避免这种问题,因为它会自动处理内存布局问题,确保操作成功。原创 2024-07-27 11:27:23 · 333 阅读 · 0 评论 -
爱因斯坦求和约定torch.einsum
是中使用的爱因斯坦求和约定,它描述了多个张量之间的元素操作方式,并生成新的张量。xyzbbatch_sizehthcnum_labelsxyzproto_dim下面是einsum的形状是[x, y, z]xyproto_dimzent_head的形状是bbatch_sizehtxproto的形状是[b, c, y]bbatch_sizecnum_labelsyproto_diment_tail的形状是bbatch_sizehtzeinsum。原创 2024-07-26 16:44:27 · 389 阅读 · 0 评论 -
深度学习处理数据中维度变换操作手册
好的,我们可以通过具体数字来更清楚地了解维度变换。原创 2024-07-26 16:07:21 · 312 阅读 · 0 评论 -
os.environ[‘CUDA_VISIBLE_DEVICES‘] = ‘2‘或者export CUDA_VISIBLE_DEVICES=2
这段代码用于设置环境变量,以指定在当前程序中可见的CUDA设备。具体来说,这段代码将CUDA设备的可见性限制为设备索引为2的GPU。此环境变量指的是python运行中的环境变量,每次更新。原创 2024-07-26 10:33:03 · 448 阅读 · 0 评论 -
python类里边__init__和def forward()传递参数的不同
首先,定义一个简单的神经网络层。在这个例子中,我们定义一个只有一个线性层的神经网络。# 定义线性层# 前向传播定义层时传递的参数用于初始化层的结构和权重,而在前向传播中传递的参数是输入数据。两者的参数不同,是因为它们在神经网络训练和推理过程中承担了不同的角色。原创 2024-07-26 09:28:41 · 231 阅读 · 0 评论 -
python里的assert断言
如果第一个断言条件成立,程序会继续执行而不会有任何提示。如果第二个断言条件不成立,程序会引发一个。语句来进行实际的错误处理。在生产环境中,应该使用异常处理机制来进行错误处理。语句用于调试目的,帮助检查某个条件是否为真。如果条件为假(即条件不成立),语句可能会被禁用(通过使用Python的优化标志。异常,并可以选择性地提供一个错误消息。值得注意的是,在生产环境中,异常,并显示错误消息。原创 2024-07-25 10:48:11 · 151 阅读 · 0 评论 -
分布式训练中的参数local_rank
local_rank是一个常用于分布式训练中的参数,用于指示当前进程的本地编号。它帮助在分布式环境中区分不同的进程。通常情况下,local_rank的值为 -1 表示不进行分布式训练,值为 0 表示第一个(主)进程,其它正数表示其它辅助进程。在分布式训练中,我们常常需要确保某些操作(例如下载模型和词汇表)只由一个进程完成,以避免重复工作和资源浪费。以下是local_rank在你的代码中,local_rank不在[-1, 0]中表示所有非主进程或非单机单卡模式的进程。原创 2024-07-23 19:29:50 · 596 阅读 · 0 评论 -
设置日志记录(logging)
这段代码用于设置日志记录(logging),以便在训练过程中能够记录和输出相关信息。具体包括设定日志格式、日志级别以及输出一些初始状态信息。原创 2024-07-23 15:40:56 · 391 阅读 · 0 评论 -
设置CUDA、GPU和分布式训练
这段代码用于设置 CUDA、GPU 和分布式训练。它会根据args的参数来确定使用的设备(CPU 或 GPU),以及是否启用分布式训练。原创 2024-07-23 15:19:40 · 473 阅读 · 0 评论 -
远程调试 Python 脚本
这段代码用于远程调试 Python 脚本,特别是通过 Visual Studio Code(VS Code)的远程调试功能。它会在指定的服务器 IP 和端口上等待调试器的连接。原创 2024-07-23 15:13:41 · 493 阅读 · 0 评论 -
随机数种子的作用
设置随机数种子(random seed)的目的是为了确保随机数生成器在每次运行时产生相同的随机数序列,从而保证实验结果的一致性。随机数种子通过初始化随机数生成器的内部状态,使得在相同的种子值下,随机数生成器每次调用时生成的序列是相同的。原创 2024-07-23 14:36:35 · 1546 阅读 · 0 评论 -
深度学习基础代码总结(持续更新)
enumerate 是 Python 的一个内置函数,它允许我们在遍历一个可迭代对象(例如列表)时,同时获取当前元素的索引和元素本身。原创 2024-07-23 13:57:00 · 144 阅读 · 0 评论 -
DocRED数据集
train_distant.json:包含远程监督(distant supervision)数据,可能是未完全标注或自动标注的训练数据,用于增强模型的训练集。load_train_annotated_rel2num.json:包含标注过的训练集关系与数量的映射,可能用于统计训练集中关系的分布。load_train_annotated.json:包含标注过的训练集数据,是训练集中标注了实体和关系的数据。load_test_rel2num.json:包含测试集关系与数量的映射,可能用于统计测试集中关系的分布。原创 2024-07-22 16:02:36 · 503 阅读 · 0 评论 -
import argparse包总结
【代码】import argparse包总结。原创 2024-07-21 20:26:21 · 117 阅读 · 0 评论 -
服务器相关总结
查看conda版本查看当前conda的配置文件位置编辑配置文件,默认路径是~/condarc在channels字段添加新的镜像源,例如清华镜像显示所有的channel添加清华镜像源原创 2024-07-19 17:26:49 · 457 阅读 · 0 评论 -
深度学习与CV入门
文章目录前言历史前言历史tensorflow可以安装Tensorboard第三方库用于展示效果TensorFlow工作流程:p6-4:20使用tf.data加载数据。使用tf.data实例化读取训练数据和测试数据模型的建立与调试:使用动态图模式Eager Execution和著名的神经网络高层API框架Keras,结合可视化工具TensorBoard,简易、快速地建立和调试模型;模型的训练:支持CPU/GPU/单机多卡GPU/多机集群/TPU训练模型,充分利用海量数据和计算资源原创 2024-07-07 14:06:21 · 437 阅读 · 2 评论 -
B样条总结篇
文章目录[曲线篇:深刻理解B 样条曲线(上)](https://www.zhihu.com/tardis/sogou/art/139759835)计算机图形学bezier曲线曲面B样条曲线曲面曲线篇:深刻理解B 样条曲线(上)B样条是贝塞尔曲线的延申,贝塞尔曲线是B样条的基础, B样条可以看成很多组贝塞尔曲线的拼接。B样条的两个性质就是贝塞尔的缺点反过来:1 可以指定阶次。2 移动控制点仅仅改变曲线的部分形状,而不改变整体B样条采用解决方案是贝塞尔曲线的拼接,也就是把一条曲线变为多段贝塞尔曲线的拼原创 2024-07-07 14:05:51 · 169 阅读 · 0 评论 -
深度学习(卷积网络、循环神经网络、对抗神经网络、Tensorflow实战)
b站视频文章目录机器学习常规套路k近邻k近邻计算流程练手的的数据集:CIFAR-10k近邻算法求上边图的差异【补充】机器学习常规套路k近邻k近邻计算流程对于未知类别属性数据集中的点:计算已知类别数据集中的点与当前点的距离按照距离依次排序选取与当前点距离最小的K个点确定前K个点所在类别的出现概率返回前K个点出现频率最高的类别作为当前点预测分类。练手的的数据集:CIFAR-10k近邻算法求上边图的差异k-近邻损失函数目的是通过不断的训练,使这个值变得越来越小【补充】1原创 2024-07-07 14:05:05 · 298 阅读 · 2 评论 -
【python教程】数据分析——numpy、pandas、matplotlib
【python教程】数据分析——numpy、pandas、matplotlib文章目录什么是matplotlib安装matplotlib,画个折线什么是matplotlibmatplotlib:最流行的Python底层绘图库,主要做数据可视化图表,名字取材于MATLAB,模仿MATLAB构建安装matplotlib,画个折线直接在pytorch环境下输入:pip install matplotlib -i http://mirrors.aliyun.com/pypi/simple/ --t原创 2024-07-07 14:04:45 · 172 阅读 · 2 评论 -
计算机图形学bezier曲线曲面B样条曲线曲面
b站视频文章目录曲线曲面基本理论曲线(面)参数表示1、显示、隐式和参数表示2、显式或隐式表示存在的问题3、参数方程曲线曲面基本理论计算机图形学三大块内容:光栅图形显示、几何造型技术、真实感图形显示。光栅图形学是图形学的基础,有大量的思想和算法几何造型技术是一项研究在计算机中,如何表达物体模型形状的技术描述物体的三维模型有三种:线框模型、曲面模型和实体模型线框模型用顶点和棱边来表示物体曲面模型只描述物体的表面和表面的连接关系(拓普关系),不描述物体内部的点的属性实体模型不但有物体的外观而且也原创 2024-07-07 14:04:16 · 462 阅读 · 2 评论 -
Linux服务器使用总结-不定时更新
【代码】Linux服务器使用总结-不定时更新。原创 2024-07-07 14:03:05 · 135 阅读 · 0 评论 -
最大化互信息Maximizing Mutual Information
互信息(Mutual Information, MI)是两个随机变量 X 和 Y 之间相互依赖程度的度量,表示为 I(X;Y)。IX;IX;Y∑x∈X∑y∈YPxylogPxPyPxyP(x, y)是 X 和 Y 的联合概率分布。P(x) 和 P(y) 分别是 X 和 Y 的边缘概率分布。原创 2024-06-26 20:10:06 · 1432 阅读 · 0 评论 -
多头注意力机制(Multi-Head Attention)
多头注意力机制的引入是为了增强模型的能力,使其能够从不同的角度关注输入序列的不同部分,从而捕捉更多层次的信息。其中 (i) 表示第 (i) 个头,(\mathbf{W}_i^Q, \mathbf{W}_i^K, \mathbf{W}_i^V) 是线性变换矩阵。如果有 (h) 个头,每个头的输出维度是 (d_k),则连接后的维度为 (h \times d_k = d_{model})。假设输入的维度是 (d_{model}),头的数量是 (h),每个头的维度是 (d_k = d_{model} / h)。原创 2024-06-23 20:46:13 · 1304 阅读 · 0 评论 -
python中不同维度的Tensor向量为何可以直接相加——广播机制
在矩阵加法中,如果两个张量的形状不同,但其中一个张量的形状可以通过广播机制扩展到与另一个张量的形状相同,则可以进行加法操作。广播机制的本质是为了简化代码编写和提高计算效率。当我们需要将某个值或较小形状的张量应用于较大形状的张量时,广播机制非常有用。它自动处理形状不匹配的问题,使得代码更简洁、更具可读性。总结起来,广播机制是深度学习框架中非常强大的工具,允许我们在维度不同的张量之间进行算术运算,只要这些张量满足广播规则。广播机制允许在执行算术运算时自动扩展张量的形状,使其兼容。在这种情况下,广播机制将。原创 2024-06-23 20:20:58 · 470 阅读 · 0 评论 -
def __init__ python特殊方法(也称为魔法方法或双下划线方法)
这些特殊方法(也称为魔法方法或双下划线方法)是由 Python 的数据模型(data model)规定的,用于定义对象的行为。它们通常用于实现内置操作和函数的行为,如算术运算、比较操作、容器类型(如列表和字典)的行为等。原创 2024-06-23 19:17:11 · 481 阅读 · 0 评论 -
bash脚本文件windows上的和linux上格式不同问题
格式问题可以使用vim进行处理,用vim打开文件,然后输入“ :set ff”,如果输出是“ fileformat=doc”,那说明是格式问题,修改文件格式,输入“:set ff=unix”,然后保存。检查下,输入“ :set ff”,如果输出是“fileformat=unix”,则说明格式正确了,这样应该就可以正常运行了。编辑和运行的环境涉及到windows和linux,那就是文件的格式问题了,因为换行符windows和linux不一样。原创 2023-07-14 16:29:32 · 633 阅读 · 0 评论