- 博客(23)
- 收藏
- 关注
原创 一文读懂Batch_Normalization和Layer_normalization
文章使用简单的例子直接可通过手动计算理解batch_normalization和layer_normalization的计算方式
2024-04-01 13:48:38
1736
1
原创 Linux系统----WSL安装anconda、cuda创建pytorch学习环境
WSL安装anconda、cuda创建pytorch学习环境
2024-02-27 20:49:27
2023
原创 windows系统下在Git Bash中激活PyTorch环境以运行脚本的步骤解析( deepspeed: command not found)
windows系统下激活深度学习环境运行.sh文件
2024-02-26 21:18:25
709
1
翻译 微调Llama 2 和Mistral
我们将介绍在现有数据上进行训练以及如何创建自己的数据集。您将学习如何格式化数据用于训练,特别是 ChatML 格式。代码保持简单,避免使用额外的黑盒或训练工具,只使用基本的 PyTorch 和 Hugging Face 软件包。
2024-02-21 16:19:37
191
原创 MiniCPM模型的简单部署
MiniCPM 是面壁与清华大学自然语言处理实验室共同开源的系列端侧语言大模型,主体语言模型 MiniCPM-2B 仅有 24亿(2.4B)的非词嵌入参数量。直接在本地运行,方便我们进一步探究该模型,接下来简单介绍一下该模型的本地部署工作安装错误```解决方案:# 模型所在目录的路径将模型目录添加到 sys.path``
2024-02-20 14:54:06
3242
2
原创 非平衡损失函数
图片中介绍了Batch-based Monte-Carlo (BMC) 方法,这是一个用于深度学习模型训练的损失函数,特别是在不确定性估计中。BMC方法不需要对训练数据的标签分布有先验知识。在BMC中,假设所有的训练标签是从训练标签分布 ( P_{train}(y) ) 中随机采样的。给定一个训练批次 ( B_y ),其中包含N个标签 ( {y(1), y(2), …L−logNy;yp。
2024-02-18 13:37:16
636
1
原创 【pytorch中3D-CNN分析】
本文介绍了3D-CNN的参数分析,可加深对三维卷积神经网络的卷积过程的理解,其次代码中的卷积网络,可以作为卷积神经网络参数分析的模板使用,对理解卷积网络均有一定的帮助
2023-10-28 09:53:54
480
1
原创 【Pytorch在win系统下解决num_workers不等于0】
num_workers,RuntimeError: DataLoader worker (pid(s) 23140) exited unexpectedly
2023-09-02 21:13:50
994
原创 创建函数时出现“value“ is not define,变量未定义
报错:“value” is not define。在新建函数时,一直出现函数未定义的情况时(如下图)可见错误已经小时,程序可以正常运行。
2023-02-26 00:01:57
1358
原创 关于3DCNN卷积网络卷积网络结构以及参数变化
计算参数数目的详细步骤(a)、(b)图分别表示单通道与多通道的2D卷积操作,其特点即L(Input_shape)=L(kernel),(c)图为3D卷积操作卷积核的深度
2023-02-13 22:55:59
2108
3D数据可视化程序,针对三维数据立方体
2024-01-29
python导入csv文件绘制曲线图
2023-03-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人