计算机视觉
雨浅听风吟
这个作者很懒,什么都没留下…
展开
-
yolov5 xml数据集转换为VOC数据集
在xml数据集中,解压后有这两个文件annotation中xml数据格式处理完后xmlToVOC.pytxt数据格式2 split train val( test)split_train_val.py进行分割并保存这里完成了原创 2022-06-30 16:04:16 · 753 阅读 · 1 评论 -
6.1 ResNet网络结构,BN以及迁移学习详解-学习笔记
原创 2021-05-26 18:31:34 · 242 阅读 · 0 评论 -
7.1MobileNet网络详解-学习笔记
转载视频https://www.bilibili.com/video/BV1yE411p7L7mobilenet v1α卷积核个数的倍率β分辨率的尺寸,不同输入分辨率的尺寸mobilenet v2原创 2021-05-26 15:09:57 · 156 阅读 · 0 评论 -
数字图像处理-2.4图像数据结构
原创 2021-05-24 17:28:53 · 330 阅读 · 0 评论 -
数字图像处理-2.3图像处理算法
原创 2021-05-24 15:03:35 · 94 阅读 · 0 评论 -
数字图像处理-2.2图像灰度直方图
原创 2021-05-24 14:41:39 · 391 阅读 · 0 评论 -
数字图像处理-2.1图像数字化
原创 2021-05-24 14:35:06 · 267 阅读 · 0 评论 -
rknn调用pytorch模型(2)-转换为rknn模型并进行推理
通过rknn自带图形界面进行转化python3 -m rknn.bin.visualization不进行量化产生了文件原创 2021-05-21 18:28:39 · 4060 阅读 · 3 评论 -
rknn调用pytorch模型(1)-pytorch模型训练-onnx模型转换
https://github.com/WitcherOfFire/pytorch-rknn-utilization.git文件组成文件全保存在github上首先创建pytorch_linear_model.py 文件模型建立import torchnet=torch.nn.Sequential( torch.nn.Linear(1,10), torch.nn.ReLU(), torch.nn.Linear(10,1))print(net)训练-转换ON原创 2021-05-21 16:24:19 · 1281 阅读 · 0 评论 -
复旦机器视觉与边缘计算-1.5人工智能与边缘计算-学习笔记
https://www.icourse163.org/learn/FUDAN-1456632162?tid=1457131443#/learn/content?type=detail&id=1232891118&cid=1251588481原创 2021-05-21 14:12:19 · 772 阅读 · 0 评论 -
linux下安装OpenVINO
https://software.intel.com/content/www/cn/zh/develop/tools/openvino-toolkit.html该网址下进行注册并下载得到压缩文件下载在Downloads下cd ~/Downloads/解压tar -xzvf l_openvino_toolkit_p_2021.3.394.tgz 进入文件夹中cd l_openvino_toolkit_p_2021.3.394/利用ui安装sudo ./install_GUI.s原创 2021-05-18 19:49:01 · 559 阅读 · 1 评论 -
霍夫变换检测圆形 -opencv
import cv2path='../../img/img.jpg'img=cv2.imread(path,1)gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)circles1 = cv2.HoughCircles(gray,cv2.HOUGH_GRADIENT,1, 30,param1=100,param2=30,minRadius=3,maxRadius=97)print(circles1)for i in circles1[0]: img=cv..原创 2021-05-18 15:47:03 · 1996 阅读 · 1 评论 -
2021-05-18
将.png 格式转变为.jpg 格式import cv2import ospath ='../../img/'print(path)for filename in os.listdir(path): if os.path.splitext(filename)[1] == '.png': img = cv2.imread(path + filename,1) newfilename = filename.replace('.png', '.jpg')原创 2021-05-18 14:09:46 · 86 阅读 · 0 评论 -
cv2 在图片上画线
import cv2# capture=cv2.VideoCapture(0)img=cv2.imread('../../img/street.jpg',1)cv2.line(img,(0,0),(100,100),color=(255,0,0),thickness=5)# 从(0,0)-》(100,100)颜色(BGR 255 是蓝)宽度是5cv2.imshow('image',img)cv2.waitKey(0)# while (True):# ref, frame = capt原创 2021-05-11 13:44:37 · 3665 阅读 · 0 评论 -
视频图片添加灰色背景条-yolo前处理
import cv2import numpy as npfrom PIL import Imagedef greybox_image(image, size):# iw=640 ih=480 iw, ih = image.size w, h = size scale = min(w/iw, h/ih) nw = int(iw*scale) nh = int(ih*scale) image = image.resize((nw,nh), Image.原创 2021-04-22 17:30:50 · 394 阅读 · 0 评论 -
将数据集中图像可视化
从数据集随即选取图片于图片框中展示import numpy as npimport utilsimport cv2from keras import backend as Kfrom vgg import VGG16import matplotlib.pyplot as pltK.set_image_data_format('channels_last')class_classification = ["cat", "dog"]if __name__ == "__main__":原创 2021-04-02 13:49:08 · 595 阅读 · 1 评论 -
python利用OpenCV调用海康威视摄像头--利用wifi路由器提供网
部署环境由于实验室只有无线网没有有线网,在这里依靠wifi路由器做出一个有线网。wifi路由器根据wifi配置有线网ip 192.168.113.17掩码 255.255.255.0网关192.168.113.254DNS 8.8.8.8在这里是网络已经可以联通。此时摄像头默认的ip地址是192.168.1.64...原创 2021-03-30 17:50:42 · 1872 阅读 · 1 评论 -
opencv读取视频图像
import cv2video = cv2.VideoCapture(0)while True: ret, frame = video.read() print(ret) #image = cv2.resize(frame, (416, 416)) #image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) #cv2.imshow("results", image) cv2.imshow("results", fram原创 2021-03-30 14:58:18 · 572 阅读 · 0 评论 -
166R-CNN边界框
转载https://www.bilibili.com/video/BV1WJ411B7nL?p=166原创 2021-03-05 18:21:35 · 1217 阅读 · 0 评论 -
165R-CNN工作原理
转载R-CNN工作原理RCNN工作原理原创 2021-03-05 16:09:14 · 102 阅读 · 0 评论 -
164Non-max suppression
参考Non-max suppression原创 2021-03-05 15:22:02 · 96 阅读 · 0 评论 -
163梯度直方图HOG
参考梯度直方图HOG如何计算梯度参考梯度直方图第一种是直接放入60-80度的格子内,第二种是10度正好在分界线,选择0-10,10-20各加2.原创 2021-03-04 17:58:58 · 98 阅读 · 1 评论 -
23 image captioning,visula question
文章目录多层递归神经网络LSTMLSTM-反向传播其他rnn我们将把输入的图像通过卷积神经网络,不过我们不是使用从一个图像网络模型中得到的softmax分值,而是使用末端4096维向量我们将用这些向量来概述整个图像的内容。当我们讨论递归神经网络时,我们必须了解第一个初始化输入,来告诉它开始生成文字。为了添加图像的信息,一种方式是用完全不同的方式整合这些信息,一个简单的方式是加入第三个权重...原创 2020-02-18 00:39:29 · 269 阅读 · 0 评论 -
22 language model学习笔记
在语言建模问题中,我们想读取一些语句,从而让神经网络在一定程度上学会生成自然语言在下图中,我们有一个字符集[h,e,l,o]和一个训练序列样例hello在这里语言模型的训练阶段,我们将这个字符序列作为输入项xt,考虑到是一个字母所以这里我们采用的方法是将其中一个字母所在元素对应index在为位置表为1其他标位0。随着数字前向传播,神经网络会接收到输入h,该输入会进入RNN单元中,之后输出y...原创 2020-02-17 20:27:46 · 309 阅读 · 0 评论 -
10.1 RNN,LSTM,.GRU递归神经网络学习笔记
文章目录概念RNN是用于处理大小可变的有序数据的一类模型即使对固定输入输出的模型,RNN也非常有用我们想对输入序列化处理,这里我们收到一个固定大小的输入,如一个图形,我们要做出分类决策,即图像中的数字分类,我们不是做单一的前向传播,而是观察图片的各种不同部分,然后在完成一组观察后做出最终决策。概念总体而言每个RNN都有这样一个小小的循环核心单元,它把x作为输出传入RNN,RNN有一个...原创 2020-02-17 16:00:59 · 804 阅读 · 0 评论 -
CS231n计算机视觉作业1-Q2-svm
[toc]支持向量机练习完成一个基于SVM的全向量化损失函数完成解析梯度的全向量化表示用数值梯度来验证你的实现使用一个验证集去调优学习率和正则化强度运用随机梯度下降去优化损失函数可视化最后的学习得到的权重...原创 2020-02-15 23:13:23 · 1675 阅读 · 0 评论 -
np.sum的用法学习笔记
sum本身很简单但是加入参数sum(a,axis=0)或者是.sum(axis=1)就会有些混淆a = np.array([[0, 1, 2]]) print(a.sum())print(a.sum(axis=0))print(a.sum(axis=1))结果得到结果可知sum是所有都相加,axis=0是第0轴相加,axis=1是第一轴相加。...原创 2020-02-13 14:45:18 · 777 阅读 · 0 评论 -
numpy中reshape的用法
numpy.reshape(a, newshape, order=‘C’)参数a:array_like要重塑的数组。newshape:int或int的元组新形状应与原始形状兼容。如果是整数,则结果将是该长度的一维数组。一种形状尺寸可以为-1。在这种情况下,该值是根据数组的长度和其余维来推断的。order:{'C','F','A'},可选使用此索引顺序读取a的元素,然后使用此索引顺...原创 2020-02-13 13:53:26 · 2204 阅读 · 0 评论 -
concatenate用法-在cs231n作业中load_CIFAR10为什么要用concatenate
def load_CIFAR10(ROOT): """ load all of cifar """ xs = [] ys = [] for b in range(1,6): f = os.path.join(ROOT, 'data_batch_%d' % (b, )) X, Y = load_CIFAR_batch(f) ...原创 2020-02-13 10:43:05 · 694 阅读 · 0 评论 -
9CNN学习笔记
文章目录回顾AlexNet卷积层池化层总览VGGgoogleNet回顾向前层和向后层使用框架后,只需要定义神经网络层的顺序AlexNetAlexNet的顺序是卷积层-池化层-归一化层-卷积-池化-归一化-一些卷积-池化-全连接卷积层输入的图像是2272273的图形,使用的卷积核是1111步长是4,所以卷积层输出的大小如上图是55.所以最后输出的卷积层大小是555596,参...原创 2020-02-04 23:39:48 · 1090 阅读 · 0 评论 -
python pickle模块用法-测试-cs231n数据集中内容
文章目录pickle模块意义模块接口实例pickle模块意义该pickle模块实现了用于序列化和反序列化Python对象结构的二进制协议。 “Pickling”是将Python对象层次结构转换为字节流的过程, “unpickling”是反向操作,从而将字节流(来自二进制文件或类似字节的对象)转换回对象层次结构。pickle模块对于错误或恶意构造的数据是不安全的。pickle协议和JSON(J...原创 2020-01-19 00:25:06 · 544 阅读 · 0 评论 -
8深度学习软件-学习笔记
文章目录cpu vs gpu软件tesorflow例子pytorchcpu vs gpugpu是图形处理卡或图形处理单元。(为什么感觉这个1070有点便宜。。。)GPU核数更多,但有一个缺点,它每个核运行的非常慢,而且执行的操作不如cpu多,gpu的核无法单独工作,它需要共同协作。多个核执行一个任务,而不是单个核单独运作。cpu和gpu另一点不同是缓存,cpu有高速缓存,虽然比较小,cp...原创 2020-01-17 15:01:11 · 1463 阅读 · 0 评论 -
Numpy的加深练习笔记
文章目录创建数组Arrays思考其他创建方法创建数组Arrays一个numpy数组是一个由不同数值组成的网格。网格中的数据都是同一种数据类型,可以通过非负整型数的元组来访问。维度的数量被称为数组的阶,数组的大小是一个由整型数构成的元组,可以描述数组不同维度上的大小。我们可以从列表创建数组,然后利用方括号访问其中的元素:import numpy as npa=np.array([1,2,3...原创 2020-01-16 14:48:16 · 284 阅读 · 0 评论 -
7.3迁移学习-学习笔记
过拟合是由于数据不足,你希望得到一个大的,功能大的模型,在你使用晓得数据集合时候容易过拟合,正则化是一种方法,另一种方法则是迁移学习,迁移学习帮助我们不需要大的训练集也能训练卷积神经网络。它的思想很简单,首先找到一些神经网络,这是vgg架构的网络,首先使用你的卷积神经网络,在一个非常大的数据集训练,比如imagenet,这里有非常大的图像去训练整个网络。现在你想吧这些模型训练出的提取特征的能力...原创 2020-01-14 15:25:51 · 198 阅读 · 0 评论 -
7.2正则化-学习笔记
正则化可以提高单一模型的效果,我们在模型中加入一些成分来防止过拟合。我们在损坏函数中多加一项,第一项是让模型拟合数据,第二项则是正则项。L2有可能意义有些不明确,目前常见的正则项的方式是dropoutdropout的道理很简单,我们在每一层的随机层,将一部分的神经元置零,每次正向传播过程中,随机被置零的神经元都不同,每次处理神经元的一层,可以从上图发现,经过dropout后神经网络的大小变...原创 2020-01-14 14:37:44 · 121 阅读 · 0 评论 -
7.1更好的优化-笔记
归一化重要性上图左图是没有中心化的,右图是中心化的。我们也可以用一条直线进行分类,但如果这条直线稍微旋转一点,我们分类器会被完全破坏,我们的损失函数对权重矩阵中的线性分类器小扰动十分敏感。右图将数据中心化,还可以减少他们的方差,在这种情况下,损失函数会不那么敏感,可以节省优化时间。batch normalization这就是在神经网络中多加一层,以使中间的激活值的均值为0方差为1SGD...原创 2020-01-14 13:46:27 · 155 阅读 · 0 评论 -
6.1激活函数-数据预处理笔记
文章目录处理过程激活函数sigmoid函数问题1 首先是饱和神经元将使梯度消失问题2 sigmoid是非0中心函数问题3 exp()是一个计算成本高的函数处理过程处理过程包括激活函数数据预处理权重初始化批量归一化训练过程监控超参的优化激活函数当输入数据,在全连接层或者卷积层,我们将输入乘上权重值,然后将结果输入一个激活函数,或非线性单元。上图是一些例子sigmoid...原创 2020-01-07 14:12:06 · 965 阅读 · 0 评论 -
5.3卷积神经网络-池化层全连接层笔记
文章目录池化池化的步骤全连接层![在这里插入图片描述](https://img-blog.csdnimg.cn/20200104233515455.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl8zOTI4OTg3Ng==...原创 2020-01-04 23:48:40 · 709 阅读 · 0 评论 -
5.2卷积神经网络-卷积笔记
文章目录卷积神经网络例子卷积神经网络在全连接层中我们将一张32323的图展开固有3072个输入,与权重矩阵相乘得到1个激活值,我们将有10个这样神经元输出。卷积层与全连接层不同在于,可以保全空间结构,不是展开,我们保存图片结构,接下来权重是一些卷积核,例子中是553的大小,我们将这个卷积核在图像上滑动,计算出每个空间定位时的点积结果。这样我们每个输入量都是553,但是它们会遍历所有通道...原创 2020-01-04 23:06:18 · 240 阅读 · 0 评论 -
CS231n计算机视觉作业1-Q1-写一个K近邻分类器(如何开始作业)
文章目录1开始2下载数据集3开始编程4加载CIFAR-10 原始数据5看数据集中的样本5.1numpy.flatnonzero():5.2 np.random.choice5.3 plt.subplot1开始从下列网站下载作业包cs231n2下载数据集需要下载CIFAR-10数据集,如果是LINUX可以直接运行如下代码cd cs231n/datasets./get_datasets....原创 2020-01-01 21:15:27 · 666 阅读 · 0 评论