无名份的浪漫2018-CSDN博客

原创人脸识别loss系列推导过程及演变

人脸识别网络结构一般的人脸识别网络，在使用的时候，只包括了上图中feature及其上面的部分。输入经过人脸检测以及对齐的待识别图片，经过CNN后得到这个图片相应的特征（feature），通过特征间的比对来判断个人信息。性能良好的人脸识别网络是可以令同一个人的不同图片输出类似的特征，而属于不同人的图片会输出差异较大的特征，目前通常判断两个特征是否相识，是通过计算两者的余弦距离来确定，也就是...

2020-08-10 15:54:35 745

原创 MXNet使用---复现、训练、测试人脸角度检测FSA-Net(SSR-MT)模型为例

FSA-Net项目是用来做人脸角度计算的模型，网络是基于SSR-Net网络(测年龄的)改进而来的，改进的过程中也形成了几个相互有所差别的版本。该模型的github链接为：https://github.com/shamangary/FSA-Net，作者的网络实现是基于keras+tensorflow实现的。由于项目需要的是caffe或者MXNet版的模型，因此做了两方面的尝试，一个是keras模型转...

2019-10-19 16:26:54 2417 38

原创 tensorflow训练好的模型转caffe模型---2019cvpr的人脸关键点PFLD模型为例

0.前言各个框架之间模型的转换非常重要，特别是对于模型部署来说。最近需要pfld的caffe模型来做人脸关键点检测，目前网上只有tensorflow的训练模型，我自己写出了caffe模型的prototxt文件，但是这个模型需要改写loss函数，caffe来搞这个很麻烦，因此我直接用目前的tensorflow模型来训练（我对tf网络模型和loss稍做修改，不过不改也可以），得到最终的tf模型及其...

2019-08-26 19:18:20 2823 11

转载 HRNet论文阅读和代码理解

8错的，有代码部分的分析https://segmentfault.com/a/1190000019167646

2019-08-14 09:33:33 5319

原创 SSD阅读和解读

GitHub上面的关于SSD的复现代码：TensorFlow版：https://github.com/balancap/SSD-Tensorflowca的mobile版：https://github.com/chuanqi305/MobileNet-SSDkeras版：https://github.com/pierluigiferrari/ssd_keraspytorch版：htt...

2019-07-11 17:23:05 567

原创 cuda9.0+tensorflow_gpu+Ubuntu16.04等环境的搭建

前言几个月前，重新弄了台电脑，再一次搭建了一下系统环境。一些当时的记录，现转化为博客。我电脑的配置：显卡：华硕1070CPU：i5-7500硬盘：120G固态+1T机械内存：8G电源：550W安装的系统配置：系统：Ubuntu16.04tensorflow：gpu的1.90cuda：9.0Python：3.7......以前自己安装的显...

2019-01-03 10:53:54 343

原创 SSD总结

-------------Z F J1 直观感受SSD是端对端的一步走的运行方式，这个方式类似于YOLO，而不同于Faster RCNN，所以速度上是类似于YOLO的速度，而高于Faster RCNN的速度，这个比较高的速度，实时性很强，可以应用到很多的场合。精度方面，SSD是采用不同的特征层进行检测（多尺度），因此就可以容纳很多不同现状、不同大小的问题的轮廓，所以在小物体的检查上面也是比...

2018-12-31 15:09:29 1195 2

原创 opencv的GPU加速的重编译过程

此文档记录opencv的GPU加速的准备工作的操作流程。本电脑的软硬件配置如下：win7的64位系统、opencv2.4.9、cuda6.5、vs2013、cmake3.80、显卡GT1050。转自本人的新浪博客。准备阶段：安装vs跟opencv就不说了。安装cuda6.5：先用鲁大师之类的软件看看是什么显卡，然后在网上看看你的显卡是否支持cuda（https://developer....

2018-09-27 09:58:36 3516 2

原创 MMAudio推理

放这些文件的地址，写进pretrained.py的cached_file（修改hf_hub_download函数应该也行的）和autoencoder.py的self.vocoder = self.vocoder = BigVGANv2.from_pretrained('path to/bigvgan_v2_44khz_128band_512x/',use_cuda_kernel=False)里面。2、下载：（注意：下载时候，用hf的镜像https://hf-mirror.com/，新加坡代理会快点）

2025-02-14 10:57:14 521

原创 jetson nano自定义液晶计时器

https://www.waveshare.net/wiki/LCD1602_I2C_Module#Jetson_nano.E4.BD.BF.E7.94.A8https://blog.csdn.net/mbjxking/article/details/115412546https://blog.csdn.net/weixin_41896770/article/details/129662615

2024-08-22 16:40:44 194

原创 ---力口---

代码随想录PDF，代码随想录网站，代码随想录百度网盘，代码随想录知识星球，代码随想录八股文PDF，代码随想录刷题路线，代码随想录知识星球八股文。数组array、字符串str、队列queue、栈stack、堆heapq、链表Node、哈希表dict、树TreeNode、图graph。动画图解、一键运行的数据结构与算法教程。编程语言基础课 | 代码随想录。

2024-07-20 18:09:50 202

原创 jetson nano + IMX219采raw图

实际操作的时候，是下载github代码为蓝本，参考资料1来改成拍raw的指令，并摸索raw的保存和imx219相机的图片buffer预处理，资料1中的相机是13.2m相机，pitch是8192，而我的相机是（3264+64）*2，且我的相机的pitch中没用的数据是放在前面的，他那个相机是放在后面的。这个64也是多次尝试后摸索出来的，不跳过pading的时候i，图片会乱码，同时会有一行一行很规律的黑线，这个黑线看起来差不多是64个像素，且是从头开始的。研究了一圈，想直接采集raw图，很难。

2024-06-22 18:11:20 1093 3

原创 cv方向之争

硕四，目前看来，cv方向里面，最火的方向有AIGC(多模态，文生图，文生视频等)，和自动驾驶感知，这两个方向里面又分为算法训练研究和算法部署两个分工。自动驾驶感知算法：经过了前几年的“预研”，和bev模式形成，自动驾驶有点产业化的苗头了，可以赚到钱了（或者说能稳定融到钱了），做这个方向能有钱途，只是可能比较卷（卷技术和学历）AIGC算法：学术界最新的方向了，都在发这方面论文。上限很高，下限未知，落地赚钱点未知（以后是做游戏画面的？AIGC部署：一般在服务器上部署。这个方向的算法有口饭吃，部署的就有口饭吃。

2023-11-28 10:30:09 482

原创自动驾驶相关

python、C++，tensorFlow、torch等框架。GPU原理，有CUDA、多核CPU软件开发，和模型部署经验。CV中的分类、检测、分割等任务有落地经验。熟悉DL、CV，的设计和优化。

2023-11-20 09:52:47 552

原创 ReuseAndDiffuse笔记

Long video classification datasets：一些较长的视频，如VideoLT数据集，用MiniGPT-4等大模型，来先分类出哪些帧是可以剪出来用的，然后再理解这些帧。平常的stable-diffusion，是图片的解码器，这样的话帧间还是有差别的，文章在解码器中间也加入了Temp-Conv，以提高帧间的连贯性。对于Unet，每层都加入两个可训练的，包含时间维度的层，Temp-Conv是针对视频数据的三维卷积，Temp-Attn是时间维度上的注意力机制。

2023-10-31 20:52:19 328

原创 docker+

使用docker部署Deepstream6.1+yolov5+Kafka_deepstream docker_羽化登仙°的博客-CSDN博客https://soulteary.com/2022/05/20/use-docker-to-run-huggingface-models.htmldocker完整深度学习环境搭建_docker 深度学习_Coding的叶子的博客-CSDN博客Ubuntu Docker 安装 | 菜鸟教程Ubuntu安装docker_故里2130的博客-CSDN博客

2023-03-25 12:14:56 164

原创 openmp多线程简单编程

OpenMP支持的编程语言包括C、C++和Fortran，简单的说，就是一种API，来编写多线程应用程序。通过使用简单的指令#pragma omp …就可以对程序进行多线程并行。OpenMP使得程序员可以把更多的精力投入到并行算法本身，而非其具体实现细节。对基于数据分集的多线程程序设计，它是一个很好的选择。但是，作为高层抽象，OpenMP并不适合需要复杂的线程间同步和互斥的场合。OpenMP的另一个缺点是不能在非共享内存系统(如计算机集群)上使用。在这样的系统上，MPI使用较多。用 OpenMP 编写的程

2021-04-19 18:13:24 922

原创制作caffe数据时的报错及解决

报错：ubuntu251@ubuntu251:/disk1/work/caffe-ssd/data/chair$ ./create_data.shTraceback (most recent call last): File "/disk1/work/caffe-ssd/scripts/create_annoset.py", line 7, in <module> from caffe.proto import caffe_pb2 File "/disk1/work/c.

2020-06-28 19:41:12 520

原创 Ubuntu1804重启后nvidia显卡驱动没了

本来电脑好好的，显卡驱动有的，tensorflow之类的gpu版也有，开机后发现：1.显示器分辨率小了很多（就是图标大了很多）2.nvidia-smi发现没了显卡驱动处理：1.找适合的显卡驱动：ubuntu-drivers devices选nvidia驱动440下载，http://www.nvidia.cn/page/home.html2.由于电脑本来就装好了驱动，所以一般的显卡驱动那些禁用自带驱动之类的就不用做了，直接给权限和安装驱动：chmod 777 ..

2020-06-15 16:00:03 4675 1

原创 mmdetection训练自己的数据出现的问题label=self.cat2label 解决

训练自己的VOC格式的数据集，只有person这一个类，出现这样的问题：打印self.cat2label出来，发现：解决方案：voc.py文件里面的classes价格逗号就行了。...

2020-03-18 17:05:11 1336 1

转载 52 个深度学习目标检测模型汇总，论文、源码一应俱全！

转自：红色石头AI有道目标检测（Object Detection）是深度学习 CV 领域的一个核心研究领域和重要分支。纵观 2013 年到 2019 年，从最早的 R-CNN、Fast R-CNN 到后来的 YOLO v2、YOLO v3 再到今年的 M2Det，新模型层出不穷，性能也越来越好！本文将会对目标检测近几年的发展和相关论文做出一份系统介绍，总结一份超全的文献 paper 列表。...

2020-03-11 15:14:01 727

原创 prototxt切片

import tensorflow as tfimport numpy as npfname = './b.prototxt'part_prototxt_file = './'all_index_ = './all_index.txt'#新建一个文件夹var_txt_ = 'var.txt'part_name = part_prototxt_file +'ccc.prototxt'...

2019-08-18 02:28:26 200

原创 CVPR2019目标检测部分论文---笔记

-----------------持续更新-----------------CVPR2019整理：https://github.com/extreme-assistant/cvpr2019《Bounding Box Regression with Uncertainty for Accurate Object Detection》对目标检测中不确定性边界框问题，在这篇论文中提出了...

2019-07-10 20:07:22 664

转载 Detectron安装教程及解决方案

转载：https://blog.csdn.net/comway_Li/article/details/85163607本博客介绍了如何安装Detectron，其依赖项（包括Caffe2）和COCO数据集。安装前所需知道的知识：a、Detectron运营商目前没有CPU实施; 需要GPU系统。b、caffe2 已经集成到pytorch1.0中，所以框架我们直接安装pytorch即可。...

2019-01-05 10:41:33 3825 2

原创 detectron训练模型

概论前提：Linux系统下安装好了detectron，安装步骤可参考detectron安装。数据集：可用的数据集有几种，其中一种最简单的方式如下图，本质上来说，是coco_train2014文件夹里面放着若干训练集的JPG图片，annotations文件夹里面放着一个json文件，是那些图片的标注信息。这里只说明训练集，测试及测试集先不弄。训练文件：******/detectron...

2019-01-04 23:30:57 1166

原创 Ubuntu16.04上的一些记录

一些又有的操作，以及一些遇到的问题及其解决方法（部分内容在博主另一个博客也提到过）：Python提示No module named skimage 解决方法:https://jingyan.baidu.com/article/fdffd1f8673187f3e98ca133.htmlubuntu16.4 修改菜单到下方:https://www.cnblogs.com/kehaimin...

2019-01-03 10:58:57 201

原创 ssd测试mAP的时候出现tensorflow版本问题

按这个博客http://www.studyai.com/article/3e454b9e#goto-page-logo来操作的，结果在测试那里出现问题，如下截图，操作步骤和原博客差不多，同学也是按这个博客来操作，也是成功测试的，网上查过很多，都没发现有类似的问题，检查了一下系统，我的tensorflow版本高于同学的，有可能是这个问题，试试吧。查看tensorflow版本：https://...

2018-12-26 17:03:29 922 3

原创一些深度学习面试题

数据增强怎么做？需要增强的原因：在训练神经网络的时候，需要大量的数据进行模型的训练，以防止模型的过拟合。还可以怎么做：增加数据量通常会有两种方式，直接增加原始数据，做数据增强。一些数据增强的方法：①.图像翻转，是做镜像翻转②.图像旋转，例如以90,180,270度旋转③.图像缩放④.随机剪裁，剪裁之后保留主要部分，但不要把含有主要特征的目标物体弄掉⑤.物体平移⑥...

2018-10-23 11:28:42 2307

原创一些吴恩达深度学习教程笔记

下降法1.梯度下降算法2.动量（Momentum）梯度下降法向着最小点的方向加速，与这个方向垂直方向减速v=β∗v+(1−β)∗v=β∗v+(1−β)∗数据 tβ越小，就越关注当前数据，也就是曲线的细节动量梯度下降法，就是在原来的梯度下降法上面改动，把参数w和b的更新参考值选为Vw而不是原来的dw，也就是选择速度。这个速度是由上一个速度以及当前的dw一起...

2018-10-03 20:08:14 517

转载编译opencv和cuda的几个注意事项==转载

转自http://blog.sina.com.cn/s/blog_b1e24f1d0102wsdr.html 原文地址：编译opencv和cuda的几个注意事项作者：小坏蛋最近要用到cuda做一些并行加速优化，由于一部分是关于图像的，所以需要用到集成了cuda的opencv库。直接在官网下载下来的opencv有些版本是没有把opencv编译进去的，所以就需要我们自己重新编译。Win...

2018-09-27 10:03:51 3014

原创 Windows上搭建Tensorflow object detection API 的环境相关操作

最近尝试建立Tensorflow object detection API 的环境，最终成功实现。这个API运行与CPU，没有做GPU的加速，因此也没安装GPU相关的插件。1.我的电脑win7-64位RAM：4GCPU：i5-3230M用到的东西：Anaconda 3-5.1.0jupyter对应的浏览器：搜狗TensorFlow...................

2018-09-01 23:19:29 2076 1

翻译部分opencv中的GPU加速函数（中文翻译）

由于项目需要，翻译了一部分可以用于我现在项目的opencv函数，记录于此，原始英文文档来自于http://blog.csdn.net/mtt_sky/article/details/42607839。getCudaEnableDeviceCount：返回已安装CUDA设备的数量;2. setDevice：设置adevice并为当前线程初始化它;3. getDev

2017-10-30 14:58:44 4615

无名份的浪漫2018

原创 AIGC-文生视频-学习之路