自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 大语言模型技术调研

大语言模型是利用深度学习技术构建的先进的计算模型,主要应用于各类自然语言处理(NLP)任务。这类模型通过在海量文本数据上进行自监督学习,能够捕捉和学习语言的复杂结构和细微的语义关系。大语言模型通常基于变换器(Transformer)架构,该架构采用自注意力机制来处理输入数据中的每个元素,并且能够并行处理,显著提高了处理效率和效果。这些模型在预训练阶段不针对特定任务进行优化,而是学习语言的通用特征,从而在后续的微调阶段能够快速适应各种具体应用,如文本摘要、情感分析、问题回答等。

2024-05-20 16:19:41 594

原创 MuseV and MuseTalk

MuseTalk通过潜在空间修复(Latent Space Inpainting)实现,能够在实时视频中实现高精度的口型与语音同步。

2024-05-20 15:29:33 458

原创 技术调研方案

明确任务目标:定义需要解决的具体问题或优化的技术点。需求收集:与相关利益相关者(如产品经理、客户、研究团队等)会谈,明确技术需求和预期成果。

2024-05-20 14:43:32 87

原创 深度学习cuda和cudnn安装

【深度学习】深度学习框架安装 CUDA+cuDNN+torch_cuda cudnn版本-CSDN博客。深度学习之CUDA+CUDNN详细安装教程 - 知乎 (zhihu.com)pytorch GPU版本安装_cuda高版本兼容低版本吗-CSDN博客。pytorch GPU版本安装_pytorchgpu-CSDN博客。

2024-05-17 23:22:21 122

原创 深度学习训练过程中损失函数值为nan

https://blog.csdn.net/demm868/article/details/104666998/ https://zhuanlan.zhihu.com/p/313102674?utm_id=0 (快速搞懂)Pytorch中的nan和inf有什么区别?_tensor([nan],-CSDN博客 入门| 一文了解神经网络中的梯度爆炸 (baidu.com) 深度学习中nan和inf的解决_nan inf-CSDN博客

2024-05-17 21:30:43 81

原创 datasets.ImageFolder和torch.utils.data.DataLoader(待完善)

待整理。

2024-05-17 17:18:13 69

原创 CUDA Toolkit、cuDNN和CUDA Toolkit

CUDA(Compute Unified Device Architecture)是NVIDIA推出的一个并行计算平台和应用编程接口(API)模型,它允许软件开发者和软件工程师使用虚拟指令集和并行计算元素的GPU进行通用计算。简单来说,CUDA让开发者能够通过特定的编程方法提高GPU的计算效率,广泛应用于高性能计算环境。

2024-05-13 00:22:32 587

原创 PyTorch中Transpose和Permute的使用说明

在 PyTorch 中,transpose和 permute是用于调整张量维度的两个非常有用的函数。它们都用于重新排列张量的维度,但它们的用法和目的有所不同。

2024-05-13 00:01:22 283

原创 python编写代码注释建议

在处理Tensor操作时,注释数据的维度和类型非常关键,尤其是在进行矩阵运算或数据重塑的时候。:在每个函数的开始部分,用几句话简要描述函数的功能和它所实现的主要操作。对于较大的模块或类,应提供详细的文档注释,说明模块或类的目的和主要功能。在代码中的关键步骤处加入注释,解释某个操作的原因或其背后的逻辑。:用来标记需要修正的问题,通常是已知的bug或不稳定的代码段。:用来标记那些暂时不处理,但将来需要实现或改进的地方。:描述函数返回值的类型及其代表的内容。:对每个参数的类型、作用进行说明。

2024-05-12 01:11:35 196

原创 stargan-v2(未待完续)

风格迁移。

2024-05-10 13:43:24 217

原创 基于DPDK高性能入侵检测系统的研究与实现

DPDKHyperscanSuricata

2024-05-06 18:42:55 80

原创 模型训练--Train.py(未待完续)

导入算法库与硬件设备路径与参数核验模块参数解析函数主函数

2024-05-06 16:20:48 83

原创 argparse.Namespace、argparse.ArgumentParser、.parse_args()三者之间的关系

、 和 之间的关系是: 创建一个解析器对象,并使用 方法解析命令行参数,将解析结果存储在 对象中。以下是详细的解释: 是一个简单的类,用于存储属性(命令行参数)。 对象可以直接用于存储解析后的命令行参数,或者可以通过 方法自动生成。示例输出argparse.ArgumentParser 是命令行参数解析器的核心类。它负责:定义:定义命令行参数及其属性(名称、类型、帮助信息等)。解析:通过 方法解析命令行参数。核心功能::添加新的参数:解析命令行参数、、:描述信息示例.pars

2024-05-05 17:07:02 261

原创 项目目录架构

README.md:提供了项目的概述、安装指导、使用示例和引用信息。: 提供一个 docker 容器环境配置,使得环境搭建更为便捷。requirements.txt:模型依赖库。存储项目使用的数据,如数据集、预处理数据等。2. network.py:网络架构的定义。: 存储预训练权重和训练后的模型权重文件。: 辅助函数集合,如文件操作、数学运算等。存储配置文件,如模型参数、环境变量等。trian.py:模型训练。valid.py:模型验证。输出模型文件和数据结果等。: 定义模型评估指标。

2024-05-05 14:31:02 203

原创 模型训练--文件(未待完续)

【代码】模型训练文件。

2024-05-04 10:42:49 59

原创 Leetcode--去掉最低工资和最高工资后的工资平均值

给你一个整数数组salary,数组里每个数都是 唯一 的,其中salary[i]是第i个员工的工资。请你返回去掉最低工资和最高工资以后,剩下员工工资的平均值。

2024-05-03 16:42:50 92

原创 Stable Diffusion XL(未待完续)

SDXL Base模型由U-Net、VAE以及CLIP Text Encoder(两个)三个模块组成,SDXL Refiner模型同样由U-Net、VAE和CLIP Text Encoder(一个)三个模块组成。

2024-05-03 15:42:48 854

原创 Transform(未待完续)

为什么编解码矩阵和空间变换基础神经网络基础词嵌入Word2Vec注意力理解Q和V交叉注意力位置编码多头注意力掩码

2024-05-03 15:40:17 99

原创 深度学习调参手册(未待完续)

深度学习的模型训练时,当问题制定、数据清理等基本工作已经完成,在模型架构和训练配置上花时间是有意义的。设置好管道,做训练和评估,为各种模型执行训练和预测工作,且选择和实施适当的衡量标准。

2024-04-29 20:49:24 16

原创 N-维数组

一、数据操作1、N维数组(机器学习和神经网络的主要数据结构)0-d(标量)1-d(向量)2-d(矩阵)3-d(RGB图片)4-d(一个RGB图片批量)5-d(一个视频批量)2、创建数组要求形状数据类型元素值代码实现:import torch#张量表示由一个数组组成的数组x=torch.arange(12)#输出张量x#输出张量形状x.shape#输出张量中元素总数x.numel()#通过reshape函数改变张量形状X=x.reshape(3,4)X

2021-08-07 22:59:24 343 1

原创 关于pytorch中@和*的用法

2021-07-29 15:44:36 1265 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除