深度学习
AI大杂烩
算法
展开
-
pytorch版本利用vggish预训练网络提取音频特征
视频多模态分类中的音频特征提取,涉及VGGish,预训练网路。原创 2022-10-20 16:03:45 · 2682 阅读 · 1 评论 -
violence-recognition-pytorch的测试代码
最近在弄视频分类的项目其中包括了暴恐识别,我用了https://github.com/swathikirans/violence-recognition-pytorch这个项目代码,将其中的代码修改为符合Pytorch1.4版本的风格,就愉快的训练了,但是发现训练完成后并没有测试代码,于是自己就写了一个,当然借鉴了作者的训练代码,很简单,在此分享出来,如果能帮助大家就更happy了。import torchimport globimport osfrom createModel import *原创 2021-03-23 15:21:27 · 438 阅读 · 0 评论 -
继前一篇文章-图像多标签分类优化
1 数据集分析结果一个好的数据集往往事半功倍,所以训练网络的前提都应该是好好分析数据集。上一篇文章说到利用pascal voc2012作为图像多标签分类的数据集,我统计出了训练集:07-08的类别总和,统计结果如下:({‘person’: 2530, ‘car’: 549, ‘chair’: 498, ‘dog’: 433, ‘cat’: 372, ‘bird’: 348, ‘bottle’: 320, ‘aeroplane’: 281, ‘tvmonitor’: 272, ‘sofa’: 264,原创 2021-03-02 17:45:06 · 448 阅读 · 2 评论 -
基于parcal voc2012数据集的图像多标签分类实战
上一篇文章中讲到如何将pascal voc2012数据集xml文件中的标签属性提取出来,本篇文章啊将会利用resnet相关网络实现多标签分类。首先利用的相关代码为 https://github.com/AI-Chen/MultiLabelClassification,其中修改了src\Utils.py中的MyDataLoader的代码:class MyDataLoader(data.Dataset): def __init__(self, transform, trainval='train',原创 2021-02-27 21:56:24 · 2118 阅读 · 10 评论 -
图像多标签分类:提取xml文件中name属性到文本中
最近两天在做图像多标签分类,首先选用的数据集为pascal voc2012, 网上关于这个数据集的介绍有很多,此处不做过多介绍。pascal voc2012的标注格式是xml,对于图像多标签分类任务,首先需将xml文件中name标签提取出来并整理成txt格式。07-08的数据集作为测试集,09-12的数据集作为训练集,文件夹格式为:datasettrainJPEGImagesannotations.txttestJPEGImagesannotations.txt其中JPEGImages里装原创 2021-02-25 15:51:14 · 1092 阅读 · 5 评论 -
linux系统离线安装Anaconda与cpu版的pytorch
一 linux离线安装Anaconda3.41 将下载好的anaconda3-2018.12上传到 所需目录下anaconda3-2018.12下载网址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/2 执行命令 bash Anaconda3-2018.12-Linux-x86_64.sh进行安装一路enter,yes,直到最后是否安装vscode时,选择no。3 查看conda是否可用,返回普通用户。conda --version原创 2020-12-08 23:09:20 · 1082 阅读 · 3 评论