深度学习
文章平均质量分 60
python+计算机视觉等
frootguo
程序媛一枚~冲鸭!
展开
-
【目标跟踪算法】Strong SORT多目标跟踪模型论文解析+代码详解
Strong SORT算法基于经典的Deep SORT模型,并从目标检测模型、表征特征模型和匹配算法等各个方面对其进行了升级优化。原创 2023-03-17 13:56:34 · 4805 阅读 · 2 评论 -
【RK3399Pro-firefly】关于可用的gpio的引脚使用(包含芯片手册引脚查询等内容)
思路需要找到一个系统中存在的gpio引脚,同时在板卡上也能找到它的对应位置。,文档里有的引脚挨个进行尝试,无论是I2C等功能,一般也都是gpio复用的;用户态使用GPIO。原创 2022-07-18 10:09:02 · 1300 阅读 · 0 评论 -
【RKNN Toolkit 1.6.0】在PC端的Ubuntu16.04中安装RKNN Toolkit 1.6.0开发环境
1. 背景目标利用RK3399pro平台,移植深度学习目标检测算法,实现嵌入式平台的深度学习应用本文在PC端的Ubuntu16.04中安装RKNN Toolkit 1.6.0开发环境,方便模型转换(例如从tensorflow平台下的.pb文件转换为RK平台下需要的.rknn文件)2. 实操步骤2.1 利用conda创建新的环境conda create -n [name] #创建名为name的conda环境,如tensorflowsource activate [name] #激活刚才创建原创 2022-02-18 16:55:14 · 2595 阅读 · 0 评论 -
【RKNN-Toolkit-Tensorflow】得到不同模型的box_priors.txt文件(如:rknn-toolkit\example\mobilenet-ssd中)
1. 背景目标利用RK3399pro平台,移植深度学习目标检测算法,实现嵌入式平台的深度学习应用2. 步骤及解决过程2.1 训练所需要的目标检测模型,利用Tensorflow object detection API完成模型的训练验证以及最终将模型转为.pb文件的形式,具体训练过程可参考如下博客:【Tensorflow object detection API】使用SSD-Mobilenet训练模型+ubuntu 16.04+python3(步骤十分清晰!)【COCO数据集】ubuntu16.04原创 2022-02-18 11:21:46 · 1570 阅读 · 8 评论 -
【COCO数据集】ubuntu16.04+python+获取并保存特定的某一类(例如“person”类)
【COCO数据集】获取并保存特定的某一类(例如“person”类)1. 开始直接找到相应的github中保存COCO特定类别的开源轮子:Jalagarto/coco_utils2. 存在问题:save_imgs函数中requests.get(im['coco_url']).content是直接从COCO的URL网络链接中下载这张图片,速度很慢,需要几个小时;采用“科学上网”依旧下载速度很慢。3. 解决办法:利用迅雷等手段快速的将整个COCO数据集从官网下载到本地,利用opencv来从本地直接读原创 2022-01-14 17:07:20 · 2529 阅读 · 0 评论 -
【CS224N-2019】斯坦福CS224N-2019自然语言处理----作业详解
CS224N-2019-Natural Language Processing with Deep Learning-solutions0. github代码仓:CS224N-2019欢迎各位star!!1. course link-课程链接: cs224n2. lecture video(2019)-课程视频链接 : video-bilibili3. 代码拥有详细注释,完美理解各个流程中tensor的shape变化,与理论计算推导过程一一对应!4. 课程相关笔记可见博客:【深度学习】cs原创 2021-12-24 11:23:37 · 746 阅读 · 0 评论 -
【论文】Lightweight SSD: Real-time Lightweight Single Shot Detector for Mobile Devices+源码github地址!
本文主要提出了一种新的轻量级目标检测模型Lightweight SSD论文下载地址:scitepress.org/Papers/2021/101880/pdf/index.html包含提出轻量级主干(backbone)结构: MBlitenet提出新的特征融合方法: CFPN提出新的position regression loss(位置回归损失函数): Biou复现YOLOv4中使用到的数据增强方法: Mosaic提出新的数据增强方式:RGBMixGray源码Github代码仓地址:ht原创 2021-09-07 14:40:23 · 230 阅读 · 0 评论 -
AttributeError:module ‘word2vec-google-news-300’ has no attribute ‘load data’
问题简述:使用如下代码直接获得word2vec-google-news-300,没有办法,因为没有翻墙,所以下不下来:import gensim.downloader as apiwv_from_bin = api.load("word2vec-google-news-300")ps:手动下载下来然后使用上述代码,就会报错AttributeError:module ‘word2vec-google-news-300’ has no attribute ‘load data’解决办法:手动下载原创 2021-03-17 15:44:30 · 1055 阅读 · 0 评论 -
【天池大赛-tf.keras】入门NLP新闻文本分类--采用(Word2vec+ GrandientBoosting)和(Word2vec+LSTM)两种方法!
【天池大赛–tf.keras】入门NLP - 新闻文本分类赛题背景介绍和链接:零基础入门NLP - 新闻文本分类方法1:Word2vec+ GrandientBoosting方法2:Word2vec+LSTM原创 2021-01-14 17:21:00 · 1097 阅读 · 8 评论 -
【TF-IDF】用python根据tf-idf计算一个文档的关键词或者短语的权重,并生成词云
【TF-IDF】用python根据tf-idf计算一个文档的关键词或者短语的权重,并生成词云1. 根据tf-idf计算一个文档的关键词或者短语:代码如下:在这里插入代码片2. 生成词云:代码如下:原创 2021-01-14 17:20:13 · 2019 阅读 · 2 评论 -
【tf-keras】CIFAR10数据集--图像分类准确率达到89.8%--整体分类过程详细分析
在构建深度学习过程最重要的步骤为:(1)模型 (2)损失函数 (3)优化器选择本博客将会从上述步骤,以CIFAR10数据集为代表,利用keras展开描述整体过程;原创 2021-01-14 17:19:10 · 2406 阅读 · 7 评论 -
【Tensorflow 目标检测中数据增强究竟起了什么作用?】探索数据增强的真正作用(通过具体模型+具体数据增强Data Augmentation方式来实例验证)
探索数据增强的真正作用只保留person和car类别,利用该voc数据集进行验证;训练不包含任何数据增强方法的mobilenet-ssd,最终map为:训练只包含random_vertical_flip(#随机垂直翻转)的mobilenet-ssd,最终map为:两个map的差别分析原因:...原创 2020-12-28 10:31:52 · 2507 阅读 · 17 评论 -
【python+Tensorflow】socket通信实战(全网最全面实现介绍!!)
python socket通信原创 2020-11-30 13:45:58 · 1333 阅读 · 9 评论 -
全网最详细解释mAP(Mean Average Precision)----利用Tensorflow Object Detection API中的PASCAL VOC的mAP计算做逐步细节解释!!
1. mAP(Mean Average Precision)首先,VOC数据集对mAP的定义:(1) True positives(TP): 被正确地划分为正例的个数,即实际为正例且被分类器划分为正例的实例数(样本数);(2) False positives(FP): 被错误地划分为正例的个数,即实际为负例但被分类器划分为正例的实例数;(3) False negatives(FN):被错误地划分为负例的个数,即实际为正例但被分类器划分为负例的实例数;(4) True negatives(TN):原创 2020-11-26 14:51:21 · 2725 阅读 · 23 评论 -
【opencv-python-tensorflow object detection API】利用opencv读取到rtsp的实时帧,采用目标检测模型对实时视频流进行检测(可用!)
利用tensorflow object detection API来训练适合工作目标检测模型,其中使用和训练方式博客链接如下:【Tensorflow object detection API】使用SSD-Mobilenet训练模型+ubuntu 16.04+python3(步骤十分清晰!)如下代码能够利用opencv实时读取到rtsp的视频流,并且采用多线程方式解决了opencv的花屏问题,将视频流送进目标检测模型,进行目标检测:import threading# 导入各种包import nu.原创 2020-11-05 14:29:33 · 942 阅读 · 2 评论 -
【opencv-python】利用opencv读取rtsp的实时帧
一开始,直接使用opencv的cv2.VideoCapture直接读取rtsp视频流,但是这样做的缺点是延迟严重、出现掉帧、花屏现象等,原因在于opencv自己有一个缓存,每次会顺序从自己的缓存中读取,而不是直接读取最新帧,代码如下:import cv2cap = cv2.VideoCapture("rtsp://admin:admin@IP地址:端口号/live0")ret,frame = cap.read()while ret: ret,frame = cap.read() .原创 2020-10-28 16:57:44 · 34672 阅读 · 29 评论 -
【tensorflow】利用ckpt文件计算模型的参数量(parameters calculation)
from tensorflow.python import pywrap_tensorflowimport osimport numpy as npimport argparsedef main(args): model_dir = args["model_dir_path"] detecotr = TOD() detecotr.paramstest(model_dir)class TOD(object): def __init__(self):原创 2020-10-16 11:23:39 · 1331 阅读 · 0 评论 -
【Tensorflow slim API】图像分类训练时在tensorboard中可视化每层卷积的输出结果(便于观察每层输出!步骤清晰有用!)
【Tensorflow slim API】图像分类训练时在tensorboard中可视化每层卷积的输出结果利用tensortflow slim API进行图像分类的步骤参考如下博客:【tensorflow-slim】使用tensroflow-slim训练自己的图像分类数据集+冻成pb文件+预测(本文针对场景分类,手把手详细教学!)具体修改其中的train_image_classifier.py文件如下:# Copyright 2016 The TensorFlow Authors. All Ri原创 2020-10-02 14:17:10 · 1626 阅读 · 9 评论 -
【tensorflow】在使用tensorboard时,突然报错ImportError libcublas.so.9.0
背景情况:训练正常、验证正常,但是在使用tensorboard可视化具体训练情况时,突然报错ImportError libcublas.so.9.0ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory查找网络上的情况,大多数是说tensorflow和cuda的版本不匹配,但是考虑训练和测试过程都正常,因此不同意这个观点最后考虑是动态链接库没有正常链接到,改正的方法就是在环.原创 2020-09-27 15:28:06 · 292 阅读 · 0 评论 -
【python】批量处理csv和txt文件(csv和txt相互转换+csv的读取和写入+txt的读取和写入)
import cv2import osimport csvcsvfile = open("/home/jari/guoshi/workspace/mobilenetssd/models-master/research/slim/mobilenet_v2_place6/placerightresult.csv","r")reader = csv.reader(csvfile)index = 0for item in reader: print(item[0]) filename原创 2020-09-25 17:19:05 · 1945 阅读 · 0 评论 -
【python3】实现HOG(histogram oriented gradient)并且将结果转换成可视化图像展示
实现HOG(histogram oriented gradient)并且将结果转换成可视化图像展示本博客采用skimage,因为如果直接采用opencv中的HOGDescriptor() ,并不具备将HOG处理后的梯度直方图再结合原图像显示功能,因此使用skimage,代码如下:import cv2import osimport numpy as npfrom skimage import exposurefrom skimage.feature import hogfrom skimag原创 2020-09-17 11:01:43 · 1408 阅读 · 2 评论 -
【python3】YOLOv4中的Mosaic数据增强方式代码
YOLOv4中的Mosaic数据增强方式实现代码Mosaic是一种通过混合4张训练图像的数据增强方式,示例如下图,这样做也同时混合了四张图片的语义,目的在于使被检测的目标超出它们普遍的语义,使得模型具有更好的鲁棒性。同时,这样做使得训练时的批量归一化(Batch Normalization,BN)操作一次统计了4张图像,能够很好的降低训练时最大的mini-batch的大小。详细具体步骤代码参考行文最后链接;裁剪图片为了拼接:# Generate sub-image datac原创 2020-09-15 14:08:33 · 1598 阅读 · 2 评论 -
【AI研习社分类相关竞赛】美丽城市--垃圾分类识别
dataimport csvimport osimport cv2filepath = '/home/jari/guoshi/workspace/classgabbage/data/train.csv'file_pathname = '/home/jari/guoshi/workspace/classgabbage/data/train'def read_path(file_pathname, special_filename, clas): #遍历该目录下的所有图片文件 .原创 2020-08-16 14:07:44 · 338 阅读 · 2 评论 -
【pytorch】Mask-RCNN官方源码剖析(Ⅲ)
模型定义(modeling)-关键部分无论是在前面的训练文件中还是测试文件中,都使用了build_detection_model(cfg)函数来创建模型,该函数可以通过配置文件组合出不同类型的模型,为了了解模型的内部定义细节,需对./maskrcnn_benchmark/modeling/下的文件进行分析:detector 模型定义了入口detectors.py 文件解析:根据给定的配置信息实例化一个generalized_rcnn.py文件解析:...原创 2020-07-24 12:20:29 · 2303 阅读 · 3 评论 -
【pytorch】Mask-RCNN官方源码剖析(Ⅱ)
./maskrcnn_benchmark/structures/定义了检测模式下包含的数据结构:bounding_box.py定义了class BoxList(object) 类,该类用于表示一系列的bounding boxes。这些boxes会以 N * 4大小的tensor来表示。为了唯一确定boxes在图片中的准确位置,该类还保存了图片的维度,另外也可以添加额外的信息到特定的bounding box中,如标签信息。import torch# transposeFLIP_LEFT_RI原创 2020-07-23 14:19:44 · 1012 阅读 · 0 评论 -
【pytorch】Mask-RCNN官方源码剖析(Ⅰ)
【pytorch】Mask-RCNN官方源码剖析原创 2020-07-21 11:03:34 · 2389 阅读 · 2 评论 -
【python3】批量删除voc数据集xml文件里的某些节点,得到单独某一类别的数据集(代码清晰,易操作!)
import xml.etree.cElementTree as ETimport os# VOC 2007 train+valpath_root = "/home/jari/guoshi/tool/personaddcar/trainval/VOCdevkit/VOC2007/Annotations/" CLASSES = ["person","car"]xml_list = os.listdir(path_root)count = 0for axml in xml_list:原创 2020-07-14 14:59:39 · 1017 阅读 · 5 评论 -
opencv[3.x]出现无法从cv::Mat转为IplImage问题(真实有用!!!)
opencv[3.x]出现无法从cv::Mat转为IplImage问题1. 各种百度谷歌到的解决办法都是cv::Mat z;IplImage z_ipl = IplImage(z);2. 继续报错说无构造函数可以接受的源类型,或构造函数重载决策不明确等话语解决办法:找到定义IplImage结构体的头文件types_c.h观察其结构体能够使用该构造函数的条件直接把这行条...原创 2020-01-20 14:59:09 · 6011 阅读 · 18 评论 -
【转载】使用TensorFlow object detection API的详细理解教程!!(帮助深入理解)
TensorFlow 训练 CNN 分类器TensorFlow-slim 训练 CNN 分类模型TensorFlow-slim 训练 CNN 分类模型(续)TensorFlow 自定义模型导出:将 .ckpt 格式转化为 .pb 格式转载 2020-07-06 11:34:15 · 1420 阅读 · 1 评论 -
【Tensorflow object detection API】使用时出现ImportError: No module named ‘nets‘报错
我在利用TensorFlow Object Detection API预训练模型训练自己的数据时出现:ImportError: No module named ‘nets’解决方法:进入Tensorflow模型的research目录执行:export PYTHONPATH=$PYTHONPATH:`pwd`:`pwd`/slim原创 2020-07-03 10:58:53 · 2886 阅读 · 0 评论 -
【Tensorflow object detection API】多GPU卡并行训练+Ubuntu 16.04(完美运行,教程步骤清晰!!)
CUDA_VISIBLE_DEVICES=0,1 python3 object_detection/legacy/train.py \ --logtostderr \ --pipeline_config_path=object_detection/ssd_model/ssd_mobilenet_v1_pets.config \ --train_dir=object_detection/ssd_model/training6 \ --num_clones=2 --ps_tasks=1.原创 2020-07-01 15:52:10 · 1066 阅读 · 4 评论 -
【tensorflow-slim】使用tensroflow-slim训练自己的图像分类数据集+冻成pb文件+预测(本文针对场景分类,手把手详细教学!)
tensorflow-slim place classicationdatasetconvert to tf4gedifangfrom __future__ import absolute_importfrom __future__ import divisionfrom __future__ import print_functionimport mathimport osimport randomimport sysimport tensorflow as tf原创 2020-06-16 11:13:55 · 1447 阅读 · 20 评论 -
【python+opencv】批量读取一个文件夹下所有的图片并处理
[python+opencv] piliangduqu yigewenjianjia suoyoutupina原创 2020-06-08 08:55:41 · 42297 阅读 · 23 评论 -
【目标检测】通过k-means算法聚类一些主流数据集的anchors
python3 gen_anchors.py -d ***/COCO/annotations -t json -k 6dataset.pyimport xml.etree.ElementTree as ETimport numpy as npimport globimport osimport jsonimport cv2class AnnotParser(object): def __init__(self, file_type): assert file_原创 2020-05-29 14:52:01 · 1889 阅读 · 1 评论 -
【Tensorflow object_detection API】使用iou loss训练时出现nan情况
First, Open file “object_detection/meta_architectures/ssd_meta_arch.py”, and add this line at the top of the file:from object_detection.core import lossesThen, add and replace a few lines of code at “loss” function:if self.groundtruth_has_field(fields.原创 2020-05-27 09:18:27 · 769 阅读 · 0 评论 -
【Tensorflow object detection API】训练模型时做数据增强的方法
修改训练所用的config文件: data_augmentation_options { random_horizontal_flip { } } data_augmentation_options { ssd_random_crop { } }可以采用的数据增强方式:normalize_image #归一化random_pixel_value_scale #随机像素值比例random_image_scale #随机图像比例random_rgb_t原创 2020-10-10 17:59:06 · 508 阅读 · 0 评论 -
【python-opencv】灰度图和彩色图的互相转换
[tensorflow]rgb-gray如果摄像头本来就得到3维度红外图那就不用处理直接可以用:import cv2cap = cv2.VideoCapture(0)ret, image_np = cap.read()直接转成单通道的灰度图看看能不能用: #如果后面不写0,那就是默认彩色的 # 第一种方式 image = cv2.imread('***/timg4.jpg',0) #第二种方式 #dst=cv2.cvtColor(src,cv2.原创 2020-05-19 10:03:44 · 22927 阅读 · 0 评论 -
【tensorflow目标检测】COCO数据集转换为tfrecord(删去原数据集漏标的完美转换方法)
https://blog.csdn.net/w_xiaomu/article/details/103078591?utm_medium=distribute.pc_relevant.none-task-blog-baidujs-1原创 2020-05-13 10:48:03 · 1502 阅读 · 11 评论 -
ubuntu16.04+Tensorflow object detection API+real-time object detection
#导入各种包import numpy as npimport osimport six.moves.urllib as urllibimport sysimport tarfileimport tensorflow as tfimport zipfileimport time from distutils.version import StrictVersionfrom collections import defaultdictfrom io import StringIOfro原创 2020-10-12 09:54:15 · 169 阅读 · 0 评论 -
【深度学习】网络模型的参数量和运算量计算
FLOPS, floating point operations per second. 每秒的浮点运算数。MADD、MACC(multiply-accumulate operations):先乘起来再加起来的运算次数。y = w[0]*x[0] + w[1]*x[1] + w[2]*x[2] + ... + w[n-1]*x[n-1]上面的运算有n次浮点乘法,n-1次浮点加法,所以总共FLOPS为2*n-1先乘后加的浮点操作有n次,所以MACC为n1.应用模型说明首先明确模型的计算量一般是衡原创 2020-05-12 10:27:29 · 4520 阅读 · 1 评论