![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
文章平均质量分 58
全息数据
用数据拟合世界。
展开
-
pip如何快速安装包 / install packet
2、需要注意的是,如果在pip中下载安装比较慢可以换个源,可以到用户文件夹下,创建一个pip文件夹,然后在pip文件夹里创建一个txt文件。1、在后面加-i https://mirrors.aliyun.com//pypi//simple。原创 2024-05-23 17:21:54 · 246 阅读 · 0 评论 -
facenet人脸检测+人脸识别+性别识别+表情识别+年龄识别的C++部署
TAO工具包基于TensorFlow和PyTorch构建,采用了迁移学习的技术,可以将用户自己的模型或预训练模型与实际或合成数据进行适配,并针对目标平台进行推理吞吐量的优化,从而使整个训练过程变得更加简单、高效。TAO工具包的使用不需要专业的人工智能知识或大量的训练数据集,因此,它可以帮助更多的人轻松进入深度学习的领域,快速实现各种应用场景。运行环境:Tensorflow。运行环境:TensorRT。运行环境:TensorRT。运行环境:TensorRT。运行环境:TensorRT。原创 2024-04-16 23:12:51 · 1121 阅读 · 3 评论 -
Stable Diffusion扩散模型【详解】小白也能看懂!!
2、因为每一个像素都有自己的分布,都要预测出一个均值和方差,所以网络输出的尺寸需要和图像尺寸一致,所以我们选用 Unet 网络,假设数据集中有100张图片,每张图片的shape是4x4x3,假设每张图片的每个channel的每个像素点都服从正态分布,图像加噪不是在原有图像上进行加噪的,而是通过把图片的每个像素的值转换为-1到1之间,比如像素的值是。去噪是加噪的逆过程,由时间T时刻的图像逐渐去噪到时刻为0的图像,求导,但是对于扩散的过程是不可行的,如下面的公式无法求出,因为。原创 2024-04-04 20:49:29 · 2090 阅读 · 1 评论 -
Stable Diffusion扩散模型推导公式的基础知识
采样这个操作本身是不可导的,也就无法通过BP来对参数进行优化。但是我们可以通过重参数化技巧,将简单分布的采样结果变换到特定分布中,如此一来则可以对参数进行求导,注意: 对于连续型随机变量,期望就是积分,满足条件的积分也可以写成期望的形式。这在之后的 公式推导过程中,我们会使用到期望与积分写法的转换,马尔可夫链:下一状态的概率分布仅取决于当前状态,与过去的状态无关。期望是指随机变量取值的平均值,用来刻画随机变量的集中位置,概括描述:已知抽取的样本,求概率分布的参数。离散型随机变量X的取值为。原创 2024-04-03 19:58:22 · 1206 阅读 · 2 评论 -
MODNet抠图模型的C++部署
也是一类前背景分割问题,但是matting不是硬分割,而是软分割(Soft Segmentation),像玻璃、头发这类前景,对应像素点的颜色不只是由前景本身的颜色决定,而是前背景颜色融合的结果,matting问题的目标就是,找出前背景颜色,以及它们之间的融合程度,以便于将前景合并到新的背景上,matting属于。参考原文:https://blog.csdn.net/qq_46675545/article/details/123738493。构建、build engine、运行。原创 2024-04-01 23:07:15 · 388 阅读 · 0 评论 -
HRNet/hrnet人体姿态估计的C++部署
骨骼点识别(Human Pose Estimation, HPE)是计算机视觉领域中的重要任务,旨在从图像或视频中检测和定位人体关节。网络需要对每个关节点的每个像素位置产生一个标签,也就是说,每个关节点的heatmap对应一个标签heatmap,因此,如果一张图片中待检测的关节点有 m 个,则网络理想状态下会。此时heatmap大致长这样,同一张图上是不同人的同一类型关键点,如第一幅图,是两个人的鼻子的位置。本文中我们使用的是bottom up的多人骨骼点检测算法——higher hrnet。原创 2024-04-01 18:57:25 · 1250 阅读 · 4 评论 -
Transformer代码从零解读【Pytorch官方版本】
输入经过词向量层和位置编码层,得到最终的输入,通过掩码注意力机制,然后交互注意力机制与Encoder的输出做交互,Encoder的输出做K矩阵、V矩阵,Decoder的值做Q矩阵,再经过前馈神经网络层,得到Decoder的输出,解码端是没法并行的,因为输入【S】,输出【I】,然后输出的【I】作为下一阶段的输入,这一次的输入取决于上一次的输出,所以解码端无法并行,如果当前输入为【S】,则后面的【卷起来】被遮挡,当输入为【S卷】时,后面的【起来】被遮挡,形成上三角矩阵为1的矩阵,如何去掉PAD信息?原创 2024-03-16 15:18:45 · 1309 阅读 · 2 评论 -
基于BatchNorm的模型剪枝【详解+代码】
如下图所示,每个conv-layer会被计算相应的channel scaling factors,然后根据channel scaling factors筛选conv-layer,达到模型瘦身的作用,图中的1.170,0.001,0.290等就是下面我们将要介绍的学习参数。L2求导为:θ,梯度下降过程越来越慢,相应的权重参数都接近0,起到平滑的作用,值是1.17,1.16,1.15等,那如何筛选比较重要的。图中的1.170,0.001,0.290等就是学习参数。越小,其对应的特征图越不重要,原创 2024-02-08 11:38:33 · 2553 阅读 · 1 评论 -
ChatGLM-6B训练本地知识库【详解】
左边是Encoding,右边是Decoding,trm的输入和输出都可以是序列,所以trm可以做文本翻译,BERT是Bidirectional Encoder Representations from Transformers的缩写,BERT是Transformer的Encoder一个预训练的语言表征模型在大量未标注的文本数据集上训练论文发表时在11个NLP任务上取得最佳指标BERT所做的事情就是把一个句子输出一个Embedding,原创 2024-02-05 11:05:07 · 1717 阅读 · 1 评论 -
Transformer结构详解【学习笔记】
然后再对Encoders(编码),Decoders(解码)进行细化,如下图,需要注意Encoders之间的结构是相同的,Decoders之间的结构也是相同的,虽然Encoders和Decoders之间各自的结构是相同的,但是是单独训练的,Encoders和Decoders的数量是超参数,可以自己定义,,依次对输入的【我爱你。下面再举一个NLP的例子,Query代表【爱】,分别与Key1,Key2,Key3,Key4代表的【我】,【不】,【爱】,【你】做点乘,具体步骤如下2图,比如输入的词是【我爱你。原创 2024-01-11 12:44:11 · 1209 阅读 · 2 评论 -
模型剪枝详解【学习笔记】
参考文献:原创 2023-12-29 10:24:03 · 533 阅读 · 0 评论 -
YOLOV5 C++部署的人员检测项目,包括CUDA编程,PTQ校准,jetson部署,开发后处理【C++深度学习部署(十一)】
需要在有界面的主机上安装,远程ssh无法使用窗口# 建议使用conda虚拟环境 # 安装 pip install labelImg # 启动 labelImg深度学习量化就是将深度学习模型中的参数(例如权重和偏置)从浮点数转换成整数或者定点数的过程。这样做可以减少模型的存储和计算成本,从而达到模型压缩和运算加速的目的。如int8量化,让原来模型中32bit存储的数字映射到8bit再计算(范围是[-128,127])。加快推理速度:访问一次32位浮点型可以访问4次int8整型数据;原创 2023-11-21 17:26:53 · 934 阅读 · 1 评论 -
一些比较好的行为识别的项目链接
2、Temporal Segment Networks (TSN) ,这个先备忘一下,GitHub链接:链接3、openpose python部署 GitHub链接:链接4、openpose+LSTM 打架识别 C++部署:GitHub链接原创 2023-10-07 12:29:26 · 119 阅读 · 0 评论 -
openpose姿态估计详解【学习笔记】
整体框架如下,1张图片经过CNN网络后分成2个网络,Parts Detection网络是预测关键点,Parts Association网络是预测方向,人体18个关键点总共需要19个不同的方向,而确定方向至少需要1个平面,即。stage越多相当于层数越深,模型感受野越大,姿态估计需要更大的感受野,因为进行关键点检测需要更多关于人体的信息,所以感受野越大则人体的信息越多,关键点检测越能检测准确。在本项目中,需要检测人体18个关键点,除了下图所标注的17个关键点外,还有1个脖子关键点。2、姿势的‘亲和力’向量。原创 2023-08-15 15:35:47 · 4248 阅读 · 0 评论 -
Pytorch分布式训练【详细】
参考:,原创 2023-04-29 14:44:53 · 105 阅读 · 0 评论 -
Nvidia Tao 【总结】
1、Tao:迁移,剪枝,支持onnx模型导入,集成在deepstream部署;2、导入onnx模型,只针对算子,不分是否为分类和分割、检测模型;5、部署问题:在哪个卡上做部署,就在哪个卡上做trt转换;4、onnx可以转到Tao,但Tao不能转化成onnx;3、vota不支持int8;原创 2023-03-20 15:35:16 · 367 阅读 · 0 评论 -
QAT量化感知训练(一)【详解】
......原创 2023-02-17 17:48:42 · 1124 阅读 · 0 评论 -
python中Path函数讲解【详细】
参考:链接1原创 2023-01-28 16:06:25 · 12419 阅读 · 0 评论 -
命令行传递参数 argparse.ArgumentParser解析
参考:链接1原创 2023-01-28 16:04:42 · 116 阅读 · 0 评论 -
centernet 数据处理
【代码】centernet 数据处理。原创 2023-01-06 19:00:20 · 4 阅读 · 0 评论 -
YoloV7 office原代码解读
参考:参考:参考:参考:参考:,原创 2023-01-04 17:33:27 · 124 阅读 · 0 评论 -
YoloV5,V6,V7之比较
3、Cls部分,每个真实框对应的先验框,获取到每个框对应的先验框后,取出该先验框的种类预测结果,根据真实框的种类和先验框的种类预测结果计算交叉熵损失,作为Cls部分的Loss组成。3、Cls部分,每个真实框对应的先验框,获取到每个框对应的先验框后,取出该先验框的种类预测结果,根据真实框的种类和先验框的种类预测结果计算交叉熵损失,作为Cls部分的Loss组成。标注数据的类别需要转成数字,如0、1等,转成后的yolo格式如下,每1行代表一个物体,依次表示为:类别、x、y、w、h。原创 2022-12-16 10:46:10 · 227 阅读 · 0 评论 -
环境变量【详解】
参考:,原创 2022-12-12 17:50:41 · 83 阅读 · 0 评论 -
如何从json格式转为xml格式(训练yolo模型数据)
【代码】如何从json格式转为xml格式(训练yolo模型数据)原创 2022-12-12 17:27:43 · 3561 阅读 · 2 评论 -
YoloV7目标检测(Pytorch官方版)【这也许是你见到最详细的博文!!!】
主干网络示意图如下,其实采用的和YoloV3、YoloV4、YoloV5类似的网络结构代码如下,多分支模块堆叠的类名为:Multi_Concat_Block输出:2.2 下采样网络结构结合了maxpooling和2 ×\times× 2步长的卷积代码如下,下采样结构类名为Transition_Block,输出:2.3 整个backbone代码整个主干网络实现代码为:输出:3、FPN特征金字塔backbone与FPN以及head代码:输出:原创 2022-12-07 20:38:03 · 10674 阅读 · 4 评论 -
YoloV6【详解】
无原创 2022-12-05 14:14:21 · 418 阅读 · 0 评论 -
crop图片后,同时修改物体相应的坐标
【代码】crop图片后,同时修改物体相应的坐标。原创 2022-11-21 18:04:53 · 228 阅读 · 0 评论 -
ConvNeXt网络【详解】
无原创 2022-11-15 14:53:48 · 417 阅读 · 0 评论 -
世界坐标系、相机坐标系和图像坐标系的转换【详解】
无原创 2022-11-11 20:05:06 · 173 阅读 · 0 评论 -
使用GIMP抠图
GMIP原创 2022-11-07 10:24:34 · 2964 阅读 · 2 评论 -
什么是卷积,卷积到底卷了啥【详解】
无原创 2022-11-07 00:13:14 · 170 阅读 · 0 评论 -
HRNet【详解】
参考:,原创 2022-10-16 16:53:31 · 207 阅读 · 0 评论 -
调整json文件
【代码】调整json文件。原创 2022-10-16 16:33:30 · 321 阅读 · 0 评论 -
修改代码标记
工作中会对代码进行修改,修改完后可能不容易找到原来修改的地方,所以在这里统一标记一下,以防混乱;原创 2022-10-13 17:00:54 · 202 阅读 · 0 评论 -
python如何截取视频中的某一段
【代码】python如何截取视频中的某一段。原创 2022-10-11 17:53:44 · 2123 阅读 · 2 评论 -
【数据处理】如何在图片中随机采样
【代码】【数据处理】如何在图片中随机采样。原创 2022-09-29 16:07:38 · 426 阅读 · 0 评论 -
图像识别检测之数据处理【总结】
如图这种处于临界的图片就不需要处理,不是好素材。原创 2022-09-19 10:21:43 · 589 阅读 · 0 评论 -
深度学习 神经网络 激活函数【详解】
激活函数原创 2022-09-15 20:11:05 · 534 阅读 · 0 评论 -
torch-->onnx
【代码】torch-->onnx。原创 2022-09-12 10:26:55 · 107 阅读 · 0 评论 -
Torch知识点总结【持续更新中......】
1、torch.no_grad上一个上下文管理器,在你确定不需要调用Tensor.backward()时可以用torch.no_grad来屏蔽梯度计算;2、在被torch.no_grad管控下计算得到的tensor,它的requires_grad就是False;原创 2022-09-07 15:02:24 · 1521 阅读 · 0 评论