深度学习
文章平均质量分 57
知北行
不积跬步,无以至千里,不积小流,无以成江海
展开
-
深度学习及mmdetection学习理解笔记
关于mmdet源码mmdetection 的网络配置中, type参数都是实例化的类名, 后面的都是对于的类初始化参数参考: MMCV 核心组件分析(五): Registry详解 MMDetection 使用技巧和源码实现。关于卷积1x1 的layer用来减少或增加输入的特征的channel, 比如resnet 中残差结构中的第一层需要减少channel, 第三层增加channel, 有几个卷积核输出就有几个channel3*3卷积 主要作用是减少网络参数, 增大有效感受野, 增加了局部上下原创 2022-05-27 12:56:34 · 2346 阅读 · 2 评论 -
mmdetection 训练时报错: Permission denied: ‘C:\\Users\\Admin\\AppData\\Local\\Temp\\tmp06sdogpt.py‘
在 mmdet 训练时使用 resume_from 参数时 , 会报错: File "D:\Anaconda3\envs\hzmd\lib\site-packages\mmcv\utils\config.py", line 251, in fromfile cfg_dict, cfg_text = Config._file2dict(filename, File "D:\Anaconda3\envs\hzmd\lib\site-packages\mmcv\utils\config.py",原创 2022-05-27 12:58:09 · 1707 阅读 · 1 评论 -
Python图片裁剪实例代码
使用的是Image中的crop(box)功能,它需要一个参数box,元组 类型,元组包括4个元素,如:(距离图片左边界距离x, 距离图片上边界距离y,距离图片左边界距离+裁剪框宽度x+w,距离图片上边界距离+裁剪框高度y+h)如图:(x, y, x+w, y+h), x,y是裁剪框左上角的坐标, x+w,y+h是右下角的坐标# -*-coding:utf-8-*-from PIL import Imageim = Image.open("renren.jpeg")# 图片的宽度和高度img_转载 2022-05-19 15:23:30 · 1069 阅读 · 0 评论 -
mmdetection2.11.0 模型测试评估及计算各个类别的map
1. 计算各个类别的map1.1 方法1: 直接计算, 仅支持voc 数据集与 custom 数据集使用如下命令直接计算各个分类的map , 使用的图片为 config 配置中test中的数据集评估python tools/test.py work_dirs/faster_rcnn_r50_fpn_1x_coco.py work_dirs/latest.pth --eval mAP# 参数说明- work_dir/faster_rcnn_r50_fpn_1x_coco.py: 模型配置文件-原创 2022-05-19 15:22:53 · 10521 阅读 · 8 评论 -
mmdetection目标检测训练过程参数解读
关于训练过程中日志记录的的map, 包含很多map, 如下{"mode": "train", "epoch": 100, "iter": 400, "lr": 0.0002, "memory": 5010, "data_time": 0.01552, "loss_rpn_cls": 0.00029, "loss_rpn_bbox": 0.0016, "loss_cls": 0.01206, "acc": 99.49316, "loss_bbox": 0.01724, "loss": 0.03119, "t原创 2022-05-19 15:22:43 · 3830 阅读 · 6 评论 -
VOC数据集转化为COCO数据集
VOC数据集转化为COCO数据集代码如下:#!/usr/bin/python# pip install lxmlimport osimport jsonimport xml.etree.ElementTree as ETfrom tqdm import tqdmSTART_BOUNDING_BOX_ID = 1PRE_DEFINE_CATEGORIES = {} # 类别id对应键值, 如果有类别关, 需要填写此项, 即VOC中names对应的类别id如 1, 2, 3...I转载 2022-05-19 15:22:32 · 729 阅读 · 1 评论 -
使用Paddle将 COCO格式数据集划分为训练集, 验证集和测试集(附Paddle安装教程)
1. 解决方法可使用PaddleX框架自带的工具,对数据集进行随机划分,首先要将数据集按照如下格式整理:MyDataset/ # 实例分割数据集根目录|--JPEGImages/ # 原图文件所在目录| |--1.jpg| |--2.jpg| |--...| |--...||--annotations.json # 标注文件所在目录在数据集按照上面格式组织后,使用如下命令即可快速完成数据集随机划分,其中val_value表示验证集的比例,test_value表示测试集的比例(可原创 2022-05-19 15:21:46 · 3192 阅读 · 1 评论 -
使用mmdetection框架训练自己的数据集
1. 数据集准备mmdet的数据集支持 coco格式和 voc 格式, 但 voc 格式官方只自带了少量网络模型文件, 所以推荐使用 coco 格式的数据集2. 修改mmdet/core/evalution/class_names.py和mmdet/datasets/coco.py中的标签为自建数据集的类别class_names.py修改如下函数:coco.py修改如下函数:重要: 修改完 class_names.py 和 voc.py 之后一定要重新编译代码,否则验证输出仍然为原类别,且训练原创 2022-05-19 15:21:33 · 10553 阅读 · 2 评论 -
Ubuntu配置深度学习环境常见问题
1. ubuntu16.04 下 卸载CUDA9.12.ubuntu系统全命令行安装anaconda 3. ubuntu解压tar.gz格式的文件的命令解压:解压test.tar.gz文件至当前目录 -C 表示指定目录 ./表示当前目录, 解压test.tar.gz文件至指定的目录,例如~/my_dirtorytar -zxvf test.tar.gz -C ~/my_dirtory压缩:将指定目录压缩 tar.gz格式文件tar -zcvf new_test.tar.gz ~/my_d原创 2022-05-19 15:21:16 · 122 阅读 · 0 评论 -
Win10安装 mmdetection 2.11.0(基于mmcv1.3.1) 及Swin-Transformer
官方已出最新版本可以直接在win下安装, 参考:久等了!Windows 平台 MMCV 的预编译包终于来了!1. 环境准备1.1 需要先安装如下环境visual studio 2015或 2019 , 安装时需勾选 使用C++的桌面开发CUDA 10.2 + CUDNNanaconda 4.6.7或以上版本通过链接下载压缩包: https://url47.ctfile.com/f/13636947-501698929-b85e1c (访问密码:7374)解压后放到你所想要安装到的目录, 因原创 2022-05-14 14:52:54 · 668 阅读 · 1 评论 -
解决win10 powershell无法使用conda虚拟环境的问题
1. powershell无法activate conda虚拟环境想从cmd换成powershell,发现powershell并不支持切换conda的虚拟环境。解决方法:打开 Powershell执行命令:conda init powershell重新打开终端即可2. 中间可能遇到的问题1. 重启 powershell 后显示无法加载文件 C:\Users\xxx\AppData\Roaming\npm\yarn.ps1,因为在此系统上禁止运行脚本。有关详细信息,请参阅 http:原创 2022-05-14 14:51:08 · 6115 阅读 · 3 评论 -
Anaconda建立新的环境,出现CondaHTTPError: HTTP 000 CONNECTION FAILED for url ...... 解决过程
进入”C:\Users\Administrator“,打开“.condarc“, 将文件内容改为:ssl_verify: trueshow_channel_urls: truechannels: - http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/win-64/ - http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/win-64/Anaconda建立新的环境,出现C转载 2022-05-14 14:49:51 · 425 阅读 · 0 评论 -
Windows 10系统下安装多版本CUDA和cuDNN
Windows 10系统下安装多版本CUDA和cuDNN(及多版本的tensorflow和pytorch)复制conda 虚拟环境:conda create -n newEnv --clone copyEnv转载 2022-05-14 14:48:55 · 222 阅读 · 0 评论 -
深度学习——使用Tesseract.js在浏览器离线识别图片中的文字
Tesseract简介Tesseract是惠普布里斯托实验室在1985到1995年间开发的一一个开源的OCR引擎,曾经在1995 UNLV精确度测试中名列前茅。但1996年后基本停止了开发。2005年,惠普将其对外开源,2006 由Google对Tesseract进行改进、消除Bug、优化工作。官网项目地址:https://github.com/tesseract-ocr/tesseractT...原创 2020-04-06 16:11:47 · 27080 阅读 · 22 评论