自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(55)
  • 资源 (4)
  • 收藏
  • 关注

原创 2020 Android Studio安装教程

昨天(2020.2.18)安装了Android Studio,踩了一些坑,同时由于网上大部分教程的版本较老,因此整合网上现有的资源以及根据自己的安装结果,在此进行记录,以便于日后自己回首以及供大家参考:Android Studio版本:3.5.3下载地址:https://developer.android.google.cn/studio其实国内很多安装的问题,都是由于国内无法访问...

2020-02-19 10:57:21 19738 11

原创 利用matplot绘制折线图(详细版-有示例数据)

【代码】利用matplot绘制折线图(详细版-有示例数据)

2024-03-22 11:19:08 304 2

原创 使用Python和PIL将RGB转换为三通道灰度图

将彩色图像转换为多通道的灰度图意味着保持图像数据的形状不变,但将每个像素的彩色表示转换为灰度值。通常灰度图像是单通道的,但如果想保持原图的三通道结构,可以用相同的灰度值填充每个通道。彩色图像通常以RGB(红、绿、蓝)格式存储,而将RGB转换为灰度值的一个常见方法是使用线性加权方法,这种方法考虑人眼对不同颜色的敏感度。灰度 = 0.2989 * R + 0.5870 * G + 0.1140 * B。使用这个公式,然后将计算出的灰度值复制到三个通道,以保持图像的多通道结构。

2024-03-22 10:09:51 257

原创 在torch包导入前import decord导致程序卡住

这两个包的导入顺序有要求,decord需要在torch后面,不然会导致程序卡住,无法运行。常用的视频解析包:decord。常用的深度学习包:torch。

2024-01-11 09:51:45 392

原创 记录一个Nan bug

torch bug 实验记录

2022-10-29 15:38:30 351 1

原创 将二维tensor矩阵中不为0元素转换为一维向量

将二维tensor矩阵中不为0元素转换为一维向量

2022-07-31 09:26:42 1755

原创 Crowd Counting-Test 获取density map及counting number

Crowd counting Test get density map and counting number.

2022-07-06 21:35:15 269

原创 Crowd Counting-计数模型测试Code

Crowd Counting 利用train好的model进行测试

2022-07-06 21:27:36 476

原创 Crowd Counting读取data及density map

Crowd Counting 加载数据集图像及标注

2022-07-06 21:18:54 287

原创 【阿里网盘】深度学习与Pytorch视频教程

我在使用不限速「阿里云盘」,赠送你 500GB 快来试试吧 ------------点此链接领取福利:https://pages.aliyundrive.com/mobile-page/web/beinvited.html?code=82530df点上面这个链接注册阿里网盘(网速很快哦),可以直接得500G(我也可以得500G)之后私聊我分享《深度学习与Pytorch视频教程》全套...

2021-11-04 15:09:38 1025

原创 批量 重命名文件夹中的图像并调整大小

图像处理任务或者日常生活中常用的一个操作:对文件夹中的图像进行批量重命名,并调整文件夹中图像的大小:import osimport cv2def rename(): image_floder="./image_floder/" number = 0 files = os.listdir(image_floder) for file in files: print(image_floder+file+" Change to --> "+image_floder+str(num

2021-10-05 10:21:56 214

原创 LaTex中的绝对值符号

在使用LaTex时发现的一个问题,目标公式如下:其中需要用到绝对值,查了一下,大多数教程中对绝对值的表述为:\left| C_{2} \right|即:用\left和\right控制左右两侧的竖杠,但是编译器会报错:Missing delimiter (. inserted). \left| C_{2} \right|因此这样来使用绝对值:\lvert 和\rvert\lvert C_{2} \rvert...

2021-08-27 10:47:24 90663 9

原创 对于两级目录下的文件进行重命名

在我们平时处理文件(图像)时,往往需要对于二级目录下的文件进行重命名,其形式如下:files | |---------dir1 | |--------------aaa.jpg --------------bbb.jpg | |---------dir2 | |--------------ccc.jpg ...

2021-05-07 16:43:13 973 3

原创 根据图像的明亮度将图像进行分类

存在一个文件夹,其中放着若干图像,现在想对这些图像,根据其明亮程度进行分类,分为10类(0-9),将图像自动移动到对应的类别中;其中涉及:1)读取图像的Y-U-V值,其中Y值代表图像的亮度;2)python中的文件读写操作;3)使用shutil进行文件的移动;# 这部分的代码可以参考用于文件的移动;可以处理其他任务;以下是代码部分:import osimport sysimport cv2import shutildef getTheBright(path): """

2021-05-07 16:32:28 629

原创 自己制作crowd counting数据集

Crowd counting的数据集包括两部分:图像部分和标签部分标签部分主要包括每个人头的坐标点:(x, y);常见的标签格式例如:ShanghaiTech数据集中的格式,用mat文件存储每个人头的坐标点,一张图像对应一个mat文件;当我们自己制作数据集时,需要经历以下几个步骤:1)拍摄图像或者视频;视频需要切分成帧;2)在图像上进行标点,标点的同时会记录下坐标点;3)根据这些坐标点生成每张图像对应的.mat文件;4)在训练时,将mat文件中的坐标转换为density .

2021-05-06 18:16:16 2137 28

原创 crowd counting 常用数据集 百度网盘

Crowd counting 常用数据集及下载地址:包括:ShanghaiTech 数据集UCF_CC_50 数据集World 10 数据集Mall 数据集USCD 数据集百度网盘下载地址:ShanghaiTech 数据集地址:链接:https://pan.baidu.com/s/1bDy-GgYi9C_R5hUuK6iZDg 提取码:c4pvUCF_CC_50 数据集地址:链接:https://pan.baidu.com/s/1Ehohkb9Q_wc..

2021-03-08 16:48:30 1388 8

原创 crowd counting——利用高斯核函数将坐标点转换为density map

在Crowd counting领域,常用的训练方法是estimate density map,这种数据可利用高斯核函数得来,在MCNN论文中有具体过程;也可参加这篇博客:https://blog.csdn.net/zxs0222/article/details/107900465存储density map的文件目前有两种:.h5文件和.cvs文件,而数据集中常见的是.mat文件,其中记录着所有人头的中心坐标点。利用.mat生成.h5的过程可参见这篇博客:https://blog.csdn.net

2021-03-08 16:39:55 1507 8

原创 Pytorch中的VGG模型

import torch.nn as nnimport torchfrom torch.nn import functional as Ffrom torchvision import modelsclass VGGModel(nn.Module): def __init__(self): super(VGGModel, self).__init__() self.VGG_feat = [64, 64, 'M', 128, 128, 'M', 256, 2.

2021-01-07 10:28:37 514

原创 将文件夹中的图像根据明亮等级分类

需求:不同的图像有不同的明亮等级,现有文件夹a,要将a中的图像(若干张)根据图像的明亮等级分为0-10,且自动分配到不同的文件夹中;如下图所示,图1为过度黑暗场景,图2为明亮场景;主要工作:将RGB到YUV空间的变化,计算Y值,并将Y值归一化,根据得到的等级进行分类;文件目录:illumination_test_images文件夹:存放需要分类的图像;illumination-level.txt:用来存放每张图像的明亮等级;illumination-test.py:主要执

2020-12-22 14:12:53 370

原创 论文阅读--Ambient Sound Helps: Audiovisual Crowd Counting in Extreme Conditions

先占个坑,正在研究;

2020-12-14 19:57:47 177 2

原创 期刊模板-如何去除左下角的横线

如图:这个横线无法被选中,如何删去这个横线?这是因为页面中插入了脚注;解决方法:光标定位于横线下方的回车处,右击,“定位至脚注”,将脚注删除,即可。

2020-12-02 16:43:50 2609

原创 Latex 将(Figure : 或者Table : )变为 (Figure . 或者 Table .)

一、只将冒号变为dot:1、添加\usepackage{caption}2、在\begin{document}加一句:\captionsetup{labelformat=default,labelsep=period}参数控制:%space去掉点%period加点%不加space、period这两个就是冒号二、深度定制:例如可将Figure 变为 Fig 等:1、添加\usepackage{caption}2、在\begin{document}加:\captio.

2020-11-30 16:10:08 5688

原创 Crowding Counter 之 根据ShanghaiTech中的.mat得到每张图片的gt人物数量

代码很简单,仅用于个人回忆以及学习:import scipy.io as iofor i in range(1, xxx): mat_road = "./GT_IMG_"+str(i)+".mat" mat = io.loadmat(mat_road) gt = mat["image_info"][0,0][0,0][0] print("The number of "+str(i)+" is: "+str(len(gt)))...

2020-11-21 17:48:58 320

原创 期刊拒稿邮件分享

新鲜的拒稿通知——主题不符内容如下:Thank you for submitting your manuscript to xxx (期刊名). After careful evaluation, I regret to inform you that your manuscript does not fit within the scope of the journal, and I must therefore reject it. I hope you are successful in.

2020-11-17 11:16:31 6134 3

原创 CNN模型的尺寸、计算量和参数数量对比

CNN模型的尺寸、计算量和参数数量对比自从AlexNet一举夺得ILSVRC 2012 ImageNet图像分类竞赛的冠军后,卷积神经网络(CNN)的热潮便席卷了整个计算机视觉领域。CNN模型火速替代了传统人工设计(hand-crafted)特征和分类器,不仅提供了一种端到端的处理方法,还大幅度地刷新了各个图像竞赛任务的精度,更甚者超越了人眼的精度(LFW人脸识别任务)。CNN模型在不断逼近计算机视觉任务的精度极限的同时,其深度和尺寸也在成倍增长。图1 几种经典模型的尺寸,计算量和参数数量.

2020-11-17 10:46:27 4069

原创 关于神经网络的轻量化

一、空洞卷积1、dilated的好处就是不做pooling损失信息的情况下,加大了感受野,让每个卷积输出都包含较大范围的信息。在图像需要全局信息或者语音文本需要较长的sequence信息依赖的问题中,都能很好的应用空洞卷积。1、2、Deep CNN对于其他任务的一些致命性缺陷,较为著名的是:up-sampling和pooling layer的设计,在Hinton的演讲中也提到过:1)上采样和池化层是不可学习的;2)内部数据接结构丢失;空间层级化信息丢失;二、ShuffleNet.

2020-11-17 10:06:29 2137

原创 旷视科技 CVPR部分文章

CVPR 2018,旷视科技:主题包括:移动卷积网络ShuffleNet、语义分割判别特征网络DFN、优化解决人群密集遮挡问题的RepLose、通过角点定位和区域分割优化场景文本检测的场景文本检测器、可复原扭曲的文档图像等;场景文字检测:《Shape Robust Text Detection with Progressive Scale Expansion Network》全景分割:《An End-to-end Network for Panoptic Segmentation》

2020-10-15 16:27:43 298

原创 Crowding Counter 之 可视化h5文件

在进行训练前,会根据.mat标注文件形成h5文件,在此对于h5文件进行可视化;代码比较简单,仅供学习~import numpy as npimport matplotlib.pyplot as pltfrom matplotlib import cm as CMimport h5pyf = h5py.File('IMG_77.h5', 'r')groundtruth = np.asarray(f['density'])plt.imshow(groundtruth,cmap=CM.je

2020-10-03 17:36:59 2526 1

原创 Crowding Counter 之 根据.mat标注制作密度图进行训练

通常,corwding counter任务中数据集只有图像和对应的标注文件,标注文件中为每个人的坐标(一个人对应一个坐标)。如果需要采用density map进行训练的话,需要生成对应的density map。本代码用于将mat文件生成对应的density map;最终用.h5文件保存;import h5pyimport scipy.io as ioimport PIL.Image as Imageimport numpy as npimport osimport globfrom

2020-10-03 15:10:51 1039 4

原创 Crowding Counter 之 裁剪图像进行数据集扩充

现有的Crowding Counter任务数据集大小均不大,例如ShanghaiTech数据集的大小就几百张,因此为了增强训练的效果,通常会将数据集进行扩充,较为简单的方法就是将原始的图像进行局部裁剪,从而达到扩充的目的。以下代码以ShanghaiTech的数据集为示例(不同示例数据集的.mat文件读取方法不同)文件说明:原始.mat文件放在groundPath/下;原始图像放在imagePath/下;因为将一张图像裁剪为9份,因此用for循环控制每一次的图像存储到单独的一个文件夹中;

2020-10-03 15:07:11 667

原创 使用python制作json格式数据

在深度学习进行数据训练时,通常需要划分训练集、验证集和测试集,有一种做法就是不进行数据的划分,而使用.json格式的数据来指定哪些数据用来训练、哪些数据用于测试;本代码用于生成json格式的文件,(仅供学习以及个人回忆)import jsonfrom os.path import joinimport globimport random# path to folder that contains imagesimg_folder = './justPoint/big_image/'

2020-10-03 14:35:50 1785 3

原创 密集人群计数 密度图回归 原理

密集人群计数,现在大家都使用密度图(density map)来进行预测人数;发现这篇简书文章对于密度图的原理讲解的比较详细,故搬来学习:https://www.jianshu.com/p/a1006c4b6fdc假设图像中的人头大小是固定的,例如MCNN中使用几何自适应高斯核来估计图像中每个人头的大小并转换为密度图;密度图中各个人头区域的概率之和为1,得到完整的人群图像密度图后,对其进行积分则是人群数目;经典文章:《Single-Image Crowd Counting via Mu

2020-08-09 21:44:08 3294

原创 Crowding Counter 之 修改ShanghaiTech数据集

ShanghaiTech数据集是适用于密集人群计数领域的经典公开数据集,其分为A\B两部分,原始数据集的图像尺寸各不相同,且标注文件和图像尺寸相对应,在使用过程中,可能需要对于图像的尺寸进行调整,同时也需要修改标注文件;文件结构:文件夹:afterProcess(带标注示意图),ground_truch(原始数据集mat文件),img(原始数据集图像文件),new_ground_truth(新生成的mat文件),new_image(新生成的图像文件),均在同一个文件夹下;为了方便,.py文件也在

2020-08-09 20:09:33 1305 7

原创 在CUDA8.0下安装pytorch1.2和torchvision0.4

事情的起源是因为:之前安装了1.0.0版本的torch和0.1.0版本的torchvision,结果在导入下面这个模块的时候就报错了from torchvision.ops import RoIPool查找资料后发现,这个模块需要 torch 1.2.0 及以上 + torchvision 0.3.0 及以上;所以重新安装,由于显卡环境为CUDA 8.0,python为3.5版本,因此可以通过下面这个命令安装:安装命令:conda install pytorch==1.2.0 t

2020-07-25 21:58:50 2910

原创 将cv2的两张图片拼接在一起

import cv2 as cvimport numpy as np # 读入图片src = cv.imread('1.jpg') # 调用cv.putText()添加文字text = "set"AddText = src.copy()cv.putText(AddText, text, (10, 10), cv.FONT_HERSHEY_COMPLEX, 2.0, (100, 200, 200), 5) # 将原图片和添加文字后的图片拼接起来res = np.hstack([src.

2020-07-22 19:43:55 6808

原创 使用cv2在图片上绘制点

数据的格式为坐标构成的list,要将这些点绘制在图片上并保存:import osimport sysimport cv2imagePath="./img/"image = cv2.imread(imagePath+"1.jpg")point_size = 1point_color = (0, 0, 255) # BGRthickness = 4 # 0 、4、8# 此处省略得到坐标的过程,coordinates存放坐标# 格式为:coordinates=[[x1,y1],[

2020-07-18 13:19:59 16332

原创 ResNet网络搭建及使用

放假前需要测试ResNet的准确度,本想着这么经典而又朴素的网络,因为有很多现成的代码可以用于学习,但大多数都只是对于网络的关键架构进行介绍以及代码实现,而对于新手来说需要一个完整可跑的框架,寻找着实不易。在git上寻找了很久,终于找到了这个可用的框架,今天对于其中的重要文件进行记录,也作为个人的回忆;git地址:https://github.com/wenxinxu/resnet-in-tensorflow该代码原本使用的是cifar数据集,并且需要从网络上进行下载,图片大小格式默认为32*3

2020-05-28 14:36:18 842 3

原创 用于测试tensorflow网络结构的代码

分享一段可以用于测试tensorflow网络结构的代码;通常我们在修改网络结构的时候,例如改变网络层数、输入输出尺寸,都需要去探索网络的结构是如何的,以及修改完以后能不能正常使用网络,那么就需要网络的测试代码来对于原有网络中的结构进行一点一点的测试以及修改尝试;基本的神经网络单元包括有输入尺寸、定义卷积核、定义激活函数、定义卷积层、定义padding以及输出的尺寸,也可能涉及标准化等操作,可以如下面的代码所示,对于这些内容进行修改,并且可以将自己网络中的结构替换过来,以进行网络结构的测试;im

2020-05-28 10:58:02 451

原创 python读取三级目录式 xml 文件

xml文件格式:<?xml version="1.0" encoding="utf-8"?><TrainingImages Version="1.0"> <Items number="37778"> <Item imageName="00016450.jpg" vehicleID="0001" cameraID="c001" colorID="1" typeID="4" /> <Item imageName

2020-05-27 11:49:25 996 1

原创 数据集的划分会影响模型的准确率

相同的网络、相同的参数(学习率、epoch),如果数据集随机划分为1:1,每次训练的结果都会不一样如下图,迭代100次,学习率均相同第一次第二次可以发现两次训练的结果还是有差异的,甚至在一些训练时模型直接崩溃,正确率始终在30%左右徘徊;...

2020-05-24 11:49:35 4477

VALSI 2020.rar

VALSI 2020 机器学习与深度学习青年研讨会; VALSI 2020 机器学习与深度学习青年研讨会; VALSI 2020 机器学习与深度学习青年研讨会; 部分讲者ppt内容截图;

2020-11-17

cifar数据集包括其TfRecord格式文件

CIFAR-10 数据集的分类是机器学习中一个公开的基准测试问题,其任务是对一组32x32RGB的图像进行分类,这些图像涵盖了10个类别: 飞机, 汽车, 鸟, 猫, 鹿, 狗, 青蛙, 马, 船以及卡车。 该压缩文件中已经将数据集进行随机混乱排布操作,分散在六个子文件夹中,其中五个作为训练集,一个作为测试集; 另外包括其制作而成的tfrecord文件,具体使用方法可参见博客; 用于训练vgg、resnet等网络

2020-05-28

redis-windows

Redis是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。从2010年3月15日起,Redis的开发工作由VMware主持。从2013年5月开始,Redis的开发由Pivotal赞助。

2018-12-03

mysql-8.0zip安装包

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,目前属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS (Relational Database Management System,关系数据库管理系统) 应用软件。 MySQL是一种关系数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。 MySQL所使用的 SQL 语言是用于访问数据库的最常用标准化语言。MySQL 软件采用了双授权政策,分为社区版和商业版,由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,一般中小型网站的开发都选择 MySQL 作为网站数据库。

2018-11-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除