目标检测
文章平均质量分 57
至尊宝♬
仍未成功,只因努力不够。
展开
-
视频提取关键帧工具类KeyFramesExtractUtils.py,动态支持三种取帧方式,关键参数可配置,代码经过优化处理,效果和性能更好。
项目中可以直接导入该工具类KeyFramesExtractUtils.py,三种取帧方式通过参数选择,method可以取"use_top_order"、"use_thresh"、"use_local_maxima"中的任何一种,第三种方式效果最佳,默认也是"use_local_maxima"。视频帧的提取率约为1.66‰,21m15s的视频,耗时约330s(即5分30秒)。...原创 2022-07-20 15:01:25 · 3858 阅读 · 7 评论 -
pycocotools在线安装--【可用】
在使用mask_rcnn进行训练时,需要pycocotools包,常规的pip命令安装会失败(主要还是c++环境的问题):比如:正确的安装命令是:pip install git+https://gitee.com/ztdztd/cocoapi.git#subdirectory=pycocotools前提:先安装Microsoft Visual C++ 14.0或以上版本。下载地址:Microsoft C++ Build Tools - Visual Studio...原创 2022-05-24 11:28:31 · 101 阅读 · 0 评论 -
视频提取关键帧的三种方式【已调通】
关键代码如下:# -*- coding: utf-8 -*-"""this key frame extract algorithm is based on interframe difference.The principle is very simpleFirst, we load the video and compute the interframe difference between each framesThen, we can choose one of t......原创 2022-04-29 17:12:53 · 10879 阅读 · 4 评论 -
tf2.6 OOM:tensorflow/core/framework/op_kernel.cc:1680] Resource exhausted: failed to allocate memory
2022-04-27 17:16:35.834265: I tensorflow/core/common_runtime/bfc_allocator.cc:1074] total_region_allocated_bytes_: 22727688192 memory_limit_: 22727688192 available bytes: 0 curr_region_allocation_bytes_: 454553763842022-04-27 17:16:35.834667: I tensorflo.原创 2022-04-28 10:16:41 · 2049 阅读 · 2 评论 -
使用python处理视频文件,提取关键帧并保存【已调通】
视频文件在进行关键内容提取的时候,人工观看,会比较费时,即使快进播放视频,一小时的视频,也需要十几分钟,或者更长时间;通常情况下,一秒钟的视频包含24帧图像,如果能够把视频中的关键帧“捕获”下来,尤其是在相似镜头拍摄时间比较久的场景,对图片去重,将有助于过滤掉绝大多数的“噪点”帧,最大程度上提取视频的核心内容。1.两个核心库PyAV和Pillow。pip install -i https://pypi.douban.com/simple/ avpip install -i https://pyp原创 2021-11-01 15:04:46 · 13447 阅读 · 27 评论 -
mask-rcnn在训练过程中,突然中断报错,提示:boolean index did not match indexed array along dimension 0;dimension is..
一、环境:win10 + gpu 3090 + maskrcnn + tensorflow2.6.0;二、报错信息如下:IndexError: boolean index did not match indexed array along dimension 0; dimension is 1 but corresponding boolean dimension is 2image_id 549image_id 85 8/20 [===========>............原创 2022-03-30 22:40:19 · 6917 阅读 · 0 评论 -
mask_rcnn神经网络算法创建自定义数据集,用labelme给图片打标注。
一、软件安装(labelme)通过“pip list”命令可以查看当前已安装的工具包;安装labelme命令:“pip install -i https://pypi.douban.com/simple/ labelme”安装成功后,如下图所示:二、图片命名要求图片名称只能包含“数字”和“字符”,必须是“jpg”格式,名称中体现分类和等级;不能是其他格式,也不能包括“空格、中文、符号”等;名称不要太短,避免重名。参考下面...原创 2022-03-21 16:18:58 · 5414 阅读 · 0 评论 -
【亲测通过】MaskRcnn_tf1.x如何升级到MaskRcnn_tf2.x,实现RTX3090环境训练自定义数据集模型。
一、背景:之前一篇博文中已经实现了maskrcnn_tf1.15.0环境的win10+cpu模型训练,但cpu训练实在是非常的耗时,据说tf1.x是支持RTX1060的(本人未测试),但不支持最新的RTX3090,查阅了很多资料,原因应该是tf1.x与tf2.x的差别比较大,必须升级到tf2.x,才可以正常使用rtx3090。下面是maskrcnn_tf1.15.0的开发案例,本人亲测可用。mask_rcnn 训练自定义数据集(本地win10系统cpu已调通,采坑无数,均已列出解决方法)_君..原创 2022-03-11 15:07:21 · 3407 阅读 · 35 评论 -
mask-rcnn报错: IndexError: boolean index did not match indexed array along dimension 0; ......
mask-rcnn在执行train.py训练模型时,报错如下:image_id 769ERROR:root:Error processing image {'id': 769, 'source': 'shapes', 'path': 'train_data/pic/4A707SG3.jpg', 'width': 820, 'height': 706, 'mask_path': 'train_data/cv2_mask/4A707SG3.png', 'yaml_path': 'train_data..原创 2022-02-14 11:32:11 · 3662 阅读 · 3 评论 -
Internal: Invoking ptxas not supported on WindowsRelying on driver to perform ptx compilation.
环境:Windows 10, gpu 3090, TF 1.15,cuda_10.0.130_411.31_win10,cuDNN 7.6.5.32mask-rcnn框架,运行train.py报错信息如下:image_id 333image_id 32image_id 582022-01-01 19:03:07.415032: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully op..原创 2022-01-03 16:47:53 · 4832 阅读 · 3 评论 -
mask-rcnn报错: AttributeError: ‘Model‘ object has no attribute ‘metrics_tensors‘
环境:win10+gpu 3090执行解决方法:原创 2022-01-01 17:36:03 · 1235 阅读 · 2 评论 -
【已解决---->“重点在后面”】win10+gpu,keras-yolov3,执行train.py训练模型,loss: nan
keras-yolov3在win10+cpu下训练模型正常;但同样的代码在win10+gpu环境下,训练模型一直显示loss:nan。1.错误信息如下:Epoch 1/502021-12-24 18:31:54.894750: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library cudnn64_7.dll2021-12-24 18:31:57.8原创 2021-12-24 18:39:40 · 1276 阅读 · 1 评论 -
win10GPU服务器,keras-yolov3执行train.py时,提示Adding visible gpu devices: 0 卡着不动
解决方法:我的电脑,右键,属性,高级系统设置,高级,环境变量,然后添加一个CUDA_CACHE_MAXSIZE变量,值为:4294967296,点击确定原创 2021-12-23 13:56:44 · 1846 阅读 · 0 评论 -
Invalid argument: Subshape must have computed start >= end since stride is negative, but is 0 and 2
keras-yolov3在win10下训练目标检测算法,【win10 + gpu 3090 +cuda_10.0.130_411.31_win10 +cudnn-10.0-windows10-x64-v7.6.5.32】报错如下:......E tensorflow/core/grappler/optimizers/meta_optimizer.cc:502] layout failed: Invalid argument: Subshape must have computed star..原创 2021-12-23 13:47:07 · 3832 阅读 · 3 评论 -
flask整合mask_rcnn模型
flask提供web框架,类似springboot,提供基本的网页开发脚手架(模板,路由,蓝图等等),用户可以根据业务需求,通过引入第三方库,添加需要的特有功能。flask与mask_rcnn同属于python系列,所以整合起来不存在语言障碍,相比于java等web框架,更得心应手。原创 2021-12-09 15:12:41 · 1487 阅读 · 2 评论 -
yolo_anchors.txt超参数值设置
keras-yolov3在训练自定义图片集之前,设置合理的yolo_anchors.txt值,有利于模型训练的收敛,一般都带有默认的参数如下:在实际项目中,yolo_anchors的值可以根据kmeans.py计算获取,通过聚类得到最佳anchors数据;kmeans.py执行后即可得到合适的yolo_anchors参数值,代码如下:import numpy as npclass YOLO_Kmeans: def __init__(self, cluster_number.原创 2021-11-22 16:03:48 · 3738 阅读 · 0 评论 -
yolo3.cfg相关配置
keras-yolov3在训练自定义图片集的时候,必须修改yolo3.cfg配置文件的相关参数。主要修改三个yolo部分,每一处都要修改三个地方。filters:3*(5+len(classes));classes: len(classes) = 16,这里共有十六中缺陷分类random:改为0 ...原创 2021-11-22 15:10:31 · 2542 阅读 · 0 评论 -
keras-yolov3 打开TensorBoard可视化界面
1.进入如下目录位置,日志文件夹的上一层:2.启动cmd命令;3.用命令启动tensorboard,“tensorboard --logdir=D:\python-workspace\keras-yolo3-master-pipelinemonitor\model_data\logs”;原创 2021-11-19 11:28:42 · 919 阅读 · 0 评论 -
keras-yolov3,目标检测分类名称乱码,方框里面是问号
使用训练好的模型“trained_weights_final.h5”测试时,类别名称显示乱码。处理方法:分类名称不可用中文,下面名称必须用英文。原创 2021-11-16 20:04:59 · 578 阅读 · 0 评论 -
yolo3,在执行“python train.py”,开始训练模型时,报错class_names = f.readlines(), ‘gbk‘ codec can‘t decode byte 0xa3
执行命令(py36_keras_yolov3_env) D:\python-workspace\keras-yolo3-master-pipelinemonitor>python train.py报错信息如下:Traceback (most recent call last): File "train.py", line 201, in <module> _main() File "train.py", line 21, in _main class_na.原创 2021-11-16 14:20:15 · 2345 阅读 · 0 评论 -
keras-yolov3执行命令“python voc_annotation.py”时,报错找不到文件“FileNotFoundError:....../.......xml”
(py36_keras_yolov3_env) D:\python-workspace\keras-yolo3-master-pipelinemonitor>python voc_annotation.pyTraceback (most recent call last): File "voc_annotation.py", line 48, in <module> convert_annotation(year, image_id, list_file) File ...原创 2021-11-15 11:06:15 · 2570 阅读 · 0 评论 -
Mask_RCNN训练目标检测模型.h5文件,Flask调用.h5模型文件报错: AttributeError: ‘str‘ object has no attribute ‘decode‘【已解决】
本项目是Flask框架调用.h5文件,实现目标检测应用(视频和图像)。1.错误截图如下:2.原因:h5py包版本过高,使用2.10.0版本就可以了。下面列出flask框架和mask_rcnn所需全部包及版本对应信息。3.解决方法:pip install -i https://pypi.douban.com/simple/ h5py==2.10.0...原创 2021-09-16 15:11:08 · 492 阅读 · 4 评论 -
labelme标注图片,并生成dataset数据集方案【本地测试成功】
1.环境:win10+annaconda+labelme==3.16.2,python3.x2.替换json_to_dataset.py文件,新内容如下:import argparse import json import os import os.pathas osp import warnings import PIL.Image import yaml from labelme import utils import base64 def main(): .原创 2021-09-05 14:35:09 · 701 阅读 · 1 评论 -
mask_rcnn:boolean index did not match indexed array along dimension 0; dimension is 0 ...(已解决)
问题:IndexError: boolean index did not match indexed array along dimension 0; dimension is 0 but corresponding boolean dimension is 1在用mask_rcnn做目标检测,训练模型时,报错如下图所示,model.py里的_idx = np.sum(mask, axis=(0, 1)) > 0mask = mask[:, :, _idx]class_ids = cla原创 2021-07-27 14:51:18 · 2608 阅读 · 0 评论 -
mask_rcnn 训练自定义数据集(本地win10系统cpu已调通,采坑无数,均已列出解决方法)
源代码地址:https://github.com/junlintianxiatjm/Mask_RCNN-master0071.版本信息python 3.6.9Tensorflow 1.15.0keras 2.2.5Pillow 5.3.0(必须,否则labelme执行json_to_dataset会出错)Cv2(必须安装,训练模型时用到)Wraptopt_einsumGastscikit-imageIPython虚拟环境完整配置库如下:..原创 2021-07-17 00:35:21 · 3945 阅读 · 18 评论