![](https://img-blog.csdnimg.cn/f9c4aaf017ec4cac83c76625cf5ae209.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
每周学习
文章平均质量分 55
记录学习研究过程
wind faded
unknown
展开
-
【本周学习】光学字符识别(OCR)
光学字符识别最早是指针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术,现在已经拓展为通过深度学习等技术对图像中的字符内容进行检测,返回文本内容和文本所在图片中的位置信息,通常为四个边界的坐标(后一段解释为个人理解)。 .........原创 2022-06-17 13:11:16 · 3416 阅读 · 0 评论 -
【效果展示】面部追踪+情绪识别
1.使用yolov5(目标检测网络)作为脸部定位模块首先标注出人脸,达到去冗余的效果2.使用先前博客中提到的多模态迁移视觉网络作为情绪识别模块,对yolov5检测为人脸的框内图像进行判别,达到更为精确的情绪识别效果,同时实现了一张图片中多个人物的情绪识别。以下为效果图:...原创 2022-04-22 23:54:31 · 3043 阅读 · 7 评论 -
孪生网络代码改动
bubbliiiing/Siamese-pytorch: 这是一个孪生神经网络(Siamese network)的库,可进行图片的相似性比较。 (github.com)https://github.com/bubbliiiing/Siamese-pytorch以上是原始代码地址:站在巨人的肩膀上!1. 对predict.py的改动: 可对比多幅图片,从而达到分类的效果# -*- coding:utf-8 -*-from function import *from PIL import Imag原创 2022-04-21 01:14:22 · 2166 阅读 · 5 评论 -
Yolov5官方网络改进:增加search模块(基于迁移学习的目标检测+多模态零样本自定义标签分类网络)
import argparseimport datetimeimport sysimport timefrom pathlib import Pathimport cv2import numpy as npimport torchimport torch.backends.cudnn as cudnnfrom numpy import random# from ResNet import *from lib.Models.experimental import attempt_loa.原创 2022-04-09 19:22:46 · 2649 阅读 · 9 评论 -
根据检测算法得到的txt文件,批量截取目标框图保存
# -*- coding: utf-8 -*-import osimport cv2def bboxcut(): # input path inputPath = input('input path:') if inputPath == '': inputPath = r'D:/GitHub/DATASET/data-coco128/images/train2017' inputPath = str(inputPath) print(f'in.原创 2022-04-07 15:09:32 · 502 阅读 · 0 评论 -
【多模态学习】本周学习历程,附链接
越学习,越是觉得所谓研究生不过是站在巨人的肩膀上领略科学之海的壮丽,十分荣幸能在开源精神的引领下参与到知识的传递网络中♪(^∇^*) 现如今,多模态学习可谓是方兴未艾,不要被多模态这个概念唬住,模态可以近似理解为视觉、听觉或触觉等不同的感受,深度学习中的多模态学习好之于计算机就好比是五感之于人类。从Bert与ViT开始,这把火彻底烧到了CV领域,Transformer架构渐有取代CNN之势,像原创 2022-03-06 21:39:52 · 3209 阅读 · 0 评论