计算机视觉
文章平均质量分 60
古月哥欠666
这个作者很懒,什么都没留下…
展开
-
gan与dcgan训练自己的数据集
一般需要设置epoch ,batch_size,out_dir,dataset,input_fname_pattern等参数,另外训练的时候加上–train,需要裁剪图片的话加上–crop与input_height,output_height,也要加上visualize进行可视化,可以查看不同批次的训练结果。其实就是batch_size设置的问题,因为代码中有开放操作,所以batch_size设置最好是能被开放整数,例如4,16,32等,另外也要注意图片总的个数大于且是batch_size的整数倍。原创 2022-11-29 11:16:57 · 2502 阅读 · 0 评论 -
利用命令行实现图片转换等操作--ImageMagick
为什么使用ImageMagick经常会遇到图片的格式转换、裁剪等批量操作,当然有许多软件可以使用,考虑到功能不太全面,且需要多个软件作为一个程序员使用命令行进行操作应该会更方便点,而且不需要下载其它软件等这里只需要安装一个ImageMagick即可ImageMagick是一款免费开源的图片编辑软件。既可以通过命令行使用,也可以通过C/C++、Perl、Java、PHP、Python或Ruby调用库编程来完成。ImageMagic的主要精力集中在性能,减少bug以及提供稳定的API和ABI上。Ima原创 2022-05-12 23:42:18 · 2289 阅读 · 0 评论 -
yolov5训练测试与源码解读
源码地址https://github.com/ultralytics/yolov5可以通过git clone 或者下载压缩包到本地项目文件夹关于yolov5其优势以及源码解读可以查看其它优秀文章,这里只是对于初次接触yolov5,且想在本地运行测试的同学借鉴这里提供运行代码需要避免的问题1.要求python>=3.7,相对应安装相匹配的opencv-python,要求opencv-python>=4.1.1,可以考虑建一个虚拟环境。清华镜像opencv-python地址https:/原创 2022-05-10 22:29:35 · 753 阅读 · 0 评论 -
利用dlib与cv2实现人脸检测和截取
dlib与opencv都包含了人脸检测接口,dlib比opencv对图片抗遮挡性强,一般数据预处理使用dlib函数库,摄像头人脸检测两者差不多,图像裁剪一般用opencv,总的来说,视频采集两者性能差不多,图片提取特征dlib更好点只限于提取人脸特征,一般图像处理尺寸、灰度用的是opencv下面直接上代码import osimport cv2import dlibimport timefrom readImage import readAllImg#从源路径中读取所有图片放入一个list,原创 2022-04-23 15:28:12 · 824 阅读 · 0 评论 -
基于深度学习的图像分类算法核心思想与算法优化总结(深度学习与图像分析-李松斌)
深度学习-图像分类算法恒等映射残差单元-ResNet多层密集连接-DenseNet特征通道重标定-SENet通道压缩与扩展-SqueezeNet深度可分离卷积-MobileNet二级目录三级目录恒等映射残差单元-ResNetResNet 是在 2015年 由何凯明等几位大神提出,斩获当年ImageNet竞赛中分类任务第一名,目标检测第一名。获得COCO数据集中目标检测第一名,图像分割第一名。残差单元原理H(x)= F(x)+x多层密集连接-DenseNethuang等2017年受ResNet启发原创 2022-04-23 15:27:13 · 5706 阅读 · 0 评论 -
利用git获取github代码
这里写目录标题利用git获取github代码下载Git软件命令行获取利用git获取github代码获取github代码可以通过直接下载zip包,或者通过Git软件通过命令行获取相应的代码,git获取代码的好处是,如果github上的仓库代码修改时,也可以通过命令对本地已经下载的代码进行更新,不需要重新下载,而且从本地上传代码也方便下载Git软件下载链接https://git-scm.com/downloads命令行获取以下是window系统获取方法1.通过cmd进入命令行 快捷键(win+R原创 2022-04-22 23:36:07 · 3840 阅读 · 0 评论 -
CNN人脸识别项目(dlib+opencv)
CNN人脸识别获取数据集读取数据集数据预处理建立模型进行预训练对图片进行人脸进行检测并进行可视化总结思路:一个CNN人脸识别项目首先必不可少的是数据集,获取的方式有网站数据库 PubFig:Public Figures Face Database、Large-scale CelebFaces Attribtes(CelebA) Dataset、BioID Face Database-FaceDB、YouTube Face等网站,或者是自己根据需求在网页抓取图像并进行图像的一些预处理操作然后是建立一个原创 2022-03-28 23:50:42 · 7444 阅读 · 1 评论 -
利用python读取文件目录和图片
读取文件主要用到os,如果读取的是图片信息,还需要利用cv框架,对于以后目标检测也有很大用处这里直接上代码读取文件图片导入模块定义字符串的后缀与标签匹配函数读取指定文件夹图片可视化图片导入模块import osimport cv2定义字符串的后缀与标签匹配函数#输入一个字符串一个标签,对这个字符串的后续和标签进行匹配def endwith(s,*endstring): resultArray = map(s.endswith,endstring) if True in re原创 2022-03-26 21:06:22 · 2903 阅读 · 0 评论 -
tensorflow与pytorch关于卷积尺寸计算不同之处
pytorch与tensorflow主要是padding的指定不同。tensorflow主要有两种方式‘same’、与‘valid’。其卷积尺寸计算公式为:注:这里假设图像尺寸长宽一样same:说明卷积之后的图像尺寸与输入图像一样,则输出图像尺寸=输入图像尺寸/卷积核步长(若除不尽,向上取整)valid:相当于padding=0,表示没有填充输出图像尺寸=(输入图像尺寸-卷积核尺寸)/卷积核步长 + 1对于pytorch的padding是指定某个数,其会有一个统一公式:输出图像尺寸=(输原创 2021-12-23 12:38:41 · 2354 阅读 · 0 评论 -
cuda与cudnn最全下载安装、更换版本方法
这里将cuda与cudnn安装涉及到的问题从都到尾进行了总结,按照对应方法即可cuda和cudnn与tensorflow版本对应关系cuda下载地址cudnn下载地址cudnn与cuda简单安装方法cudnn与cuda详细安装方法【Windows 10】多个CUDA版本之间的切换以上内容皆为转载优秀博客内容,没办法自己太懒了...原创 2021-12-20 11:59:52 · 289 阅读 · 0 评论 -
yolo-v4-预测图像绘制
def detect_image(self, image): #---------------------------------------------------# # 计算输入图片的高和宽 #---------------------------------------------------# image_shape = np.array(np.shape(image)[0:2]) #------------...原创 2021-11-08 19:47:35 · 2601 阅读 · 0 评论 -
基于opencv的情绪检测
传统的情绪检测是用级联检测器来实现,也可以通过卷积网络训练模型来实现。为了可以很好的进行图像预测,首先需要进行模型的训练1.导入模块from __future__ import print_functionimport kerasfrom keras.preprocessing.image import ImageDataGeneratorfrom keras.models import Sequentialfrom keras.layers import Dense,Dropout,Acti原创 2021-10-09 18:34:32 · 1653 阅读 · 1 评论 -
基于opencv的人脸、眼睛、鼻子、微笑识别
对于眼睛、鼻子等识别需要首先进行opencv人脸识别,这样减少计算量主要步骤如下:1.导入级联检测器,一般下载cv2会自带一些xml文件,除了mouth、nose需要另外下载然后放到D:\miniconda\Lib\site-packages\cv2\data文件夹下,下载地址2.导入图片或者摄像头3.利用face_cascade.detectMultiScale函数找到对应检测的坐标4.进行检测区域的画框主要代码为:import cv2face_cascade = cv2.Cascade原创 2021-10-08 18:02:56 · 1756 阅读 · 0 评论 -
opencv实战项目:基于opencv的车牌号码识别
首先,呈上我自己根据代码写的步骤流程,方便记忆,字有点丑,哈哈哈!!!好吧,图片看不清,那就上代码import cv2import imutilsimport numpy as npimport pytesseractpytesseract.pytesseract.tesseract_cmd = r'D:\Program Files\Tesseract-OCR\tesseract.exe'img = cv2.imread('D:/skoda1.png',cv2.IMREAD_COLOR)原创 2021-09-28 16:23:47 · 794 阅读 · 0 评论 -
Keyword argument not understood:‘, ‘input‘)与fit_generator() got an unexpected keyword argument ‘samp
Keyword argument not understood:‘, ‘input‘)解决办法:分析代码model = Model(input=inputs, output=[nestnet_output_4]),keras版本问题。换成model = Model(inputs=…, outputs=…)fit_generator() got an unexpected keyword argument 'samp解决办法:依然是版本问题,按照以下格式修改history_object = mod原创 2021-09-02 10:27:38 · 1342 阅读 · 0 评论 -
文档扫描OCR识别的安装
步骤先下载tesseract,选择一个版本即可tesseract地址如果C盘有限,可以将默认的地址C盘改为D盘即可例如:D:\Program Files \Tesseract-OCRwindow中命令行运行1.如果需要在window命令行中运行,需要配置环境变量在用户变量和系统变量的path中,都新增一个tesseract的路径,该路径为上面的安装路径。2.通过在命令行输入tesseract -v,若得到相应版本信息则配置成功。3.测试图片,cd到图片所在位置,用 tesseract原创 2021-08-29 18:26:46 · 611 阅读 · 0 评论 -
An exception has occurred, use %tb to see the full traceback.----parser.parse_args()报错
parser.parse_args报错:方法一方法二报错:jupyter notebook中,args不为空。方法一改成args = parser.parse_args(args=[])方法二这个错误只在用IPython时发生,用命令行的python时不会发生原创 2021-08-27 14:55:18 · 885 阅读 · 0 评论