自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

pywin

学无止境。。。

  • 博客(143)
  • 资源 (3)
  • 收藏
  • 关注

原创 OCR手写字体生成数据

简述: 根据CASIA的HWDB1.X的手写字符生成了一些带有字符级标注、行级别标注的文本数据,分享给需要的同学。生成基于不同人的字体、字体大小、行间字体间隔、旋转角度、文本布局的文字贴图。 生成素材:共65种贴图背景, 由420位手写字体作者完成的71,122个符号,1,609,136个汉字/3,866类。 数据量:Train:2597张, Test:662张,目前完了HWDB1.0部分,part2,part3如果需要后期可以继续制作。字符素材:数据示例:...

2020-10-29 19:14:36 11713

原创 CASIA-HWDB2.x(offline)数据集合并为page类型,并标出行级别的bbox

最近要做行级别的手写文件检测工作,将CASIA-HWDB2.x(offline)数据进行合并,生成了page level的数据集,还带有相应的bbox。如果大家想交流ocr相关的工作可以加群(文章末尾):CASIA-HWDB2.x(offline)数据集下载地址:http://www.nlpr.ia.ac.cn/databases/handwriting/Download.html我所下载的是这一部分:CASIA-HWDB2.x(offline)数据集解析可以参考:https://www.f

2020-09-30 11:05:53 11565 9

原创 YOLOV3网络模型

YOLOV3

2022-02-28 23:08:31 327

原创 YOLOV2网络模型

yolov2网络模型

2022-02-23 10:14:30 3410

原创 NMS非极大值抑制算法原理

NMS非极大值抑制算法

2022-02-22 15:46:08 1823

原创 YOLOV1网络模型

YOLOV1

2022-02-22 15:30:12 1912

原创 Global Convolutional Network(GCN)网络模型

Global Convolutional Network

2022-02-18 17:13:18 408

原创 MobileNetV1&MobilenetV2模型

mobilenetV1 mobilenetV2 模型框架

2022-02-17 20:57:23 825

原创 【详细】python打包exe文件,pycharm+pyinstaller打包成功

pyinstaller, python,带资源一起打包成exe文件

2022-02-16 14:40:44 2523

原创 ResNet18、50模型结构

resnet18和resnet50模型结构

2022-02-11 16:49:44 7595

原创 python opencv 已知图片和mask,抠出mask区域

目录前言:目标:思路:完整代码:前言在ICDAR2021竞赛中,需要取出图片中需要分割的样本,对样本进行仿射变换,背景替换,生成更丰富的样本。目标结合mask取出input中的两张卡片 input mask ...

2021-07-01 11:31:25 2322 4

原创 python opencv 利用鼠标点击事件移除标记区域

上图中左边的图是需要进行移除正方形上的多边形,右图是移除后的结果。操作也比较简单,使用鼠标在多边形外围点击四下就可以移除该区域了,鼠标点击用左图红色圆圈表示。具体实现如下代码:#-*- coding:utf-8 -*-import cv2import pandas as pdimport numpy as npimport os...

2021-04-26 16:18:43 199 1

原创 linux 复制除某个文件夹外所有的文件

例如root/file/ 目录下有data、train.py、inference.py、utils等文件或文件夹,要复制除data文件夹以外所有的文件到copy_file目录下先进入要复制的root/file/ 目录下,执行以下命令:cp -r `ls |grep -v data|xargs` ../copy_file/...

2021-03-16 11:29:48 4533 1

原创 pip错误 ImportError: No module named ‘pip‘

今天在使用pip的时候,发现问题,ImportError: No module named 'pip' 。anaconda下只有一个版本的python:使用一下代码,重新激活pip。2.7版本:curl https://bootstrap.pypa.io/pip/2.7/get-pip.py -o get-pip.py3.5版本:curl https://bootstrap.pypa.io/pip/3.5/get-pip.py -o get-pip.py3.5+版本.

2021-03-11 14:22:28 1025 1

原创 根据两个矩形顶点坐标判断两个矩形是否相交

def is_intersect(coord1, coord2): crd_min_x = min(np.array(coord1).flatten()[0::2]) crd_max_x = max(np.array(coord1).flatten()[0::2]) crd_min_y = min(np.array(coord1).flatten()[1::2]) crd_max_y = max(np.array(coord1).flatten()[1::2]) #.

2021-03-03 10:07:14 405

原创 启动jupyter

win键-->输入cmd-->jupyter notebook

2021-02-18 09:58:05 56

原创 numpy选择没有零的行

import numpy as npdata = np.array([[1, 2, 3, 4], [0, 0, 3, 4], [5, 6, 7, 8], [9, 9, 1, 0]])result = data[np.all(data, axis=1)]结果:[[1 2 3 4] [5 6 7 8]]

2020-12-22 09:29:32 227

原创 给定一个list的set及set中元素被选取的概率,从list中按set元素的概率抽取若干个数

import randomimport numpy as npa = list(range(0, 9)) #a = [0,1,2,3,4,5,6,7,8]a_ = list(range(0, 10)) #a_ = [0,1,2,3,4,5,6,7,8,9]b = a * 5 + [9] * 2 #b = [0,1,2,3,4,5,6,7,8,...,9,9]random.shuffle(b)p1 = (1/5) / ((1/5)*9 + (1/2))p2 = (1/2) / (.

2020-11-25 15:01:12 321

原创 python opencv 将两张图以一定的透明度融合

先上结果:图1:图2:融合结果:代码:#-*- coding:utf-8 -*-import cv2import numpy as npimport randomimport osif __name__=='__main__': bg_path = r'G:\PAdatasets\openDatasets\OCR\collectOcrData\high_resolution_img' pages_path = r'G:\check\ocr\hc

2020-11-05 17:20:40 16607

原创 python opencv 分别取出图像中黑白部分

将图片中的黑白部分分别提出来需要用到cv2.threshold(src, thresh, maxval, type)函数,其中参数分别表示为:src:表示的是图片源 thresh:表示的是阈值(起始值) maxval:表示的是最大值 type:表示的是这里划分的时候使用的是什么类型的算法**,常用值为0(cv2.THRESH_BINARY)**示例:syn_img = cv2.imread(r'xxx.jpg')#小于220,赋值为255,其他值为0_, syn_binary_i

2020-11-05 15:29:42 17769

原创 多进程保存图片,不报错但未保存成功

先上有问题的代码:import multiprocessingimport timeimport cv2import osdef run(ts): img = cv2.imread(r'E:\untitled2\Company\hccr\example\rotate.jpg') cv2.imwrite(os.path.join(root, 'img_{}.jpg'.format(ts)), img) print("end")if __name__ == "__ma

2020-10-26 15:07:45 149

原创 GazeBase

《GazeBase: A Large-Scale, Multi-Stimulus, Longitudinal Eye Movement Dataset》下载地址:https://figshare.com/articles/Raw_data/12912257GazeBase is a large-scale longitudinal dataset consisting of 12,334 monocular (left) eye-movement recordings captured from 3

2020-09-17 09:43:38 73

原创 【简单】torch.sactter_(),一遍看懂

看了一大堆的博客,有的博客几乎是照搬别人的博客,没啥意义。另一些个人感觉写得没有抓住本质。最常见的官方示例:>>> x = torch.rand(2, 5)>>> x 0.4319 0.6500 0.4080 0.8760 0.2355 0.2609 0.4711 0.8486 0.8573 0.1029[torch.FloatTensor of size 2x5]>>> torch.zeros(3, 5).sc.

2020-09-14 18:13:33 118 1

原创 去除字符串中的引号

#第一种,只去除两边的引号,保留中间字符的引号def my_strip(str, char): if str[0] == char:str = str[1:] if str[-1] == char:str = str[:-1] return strst1 = '"csdn csdn,"csdn""'st_rm1 = my_strip(st1, '"')print(st_rm1)#结果:csdn csdn,"csdn"#第二种,去除所有的引号import re.

2020-09-04 14:50:37 18752

原创 shell 创建文件夹

#!/bin/bashdir="/root/test_dir"if [ ! -d "$dir" ];thenmkdir $direcho "创建文件夹成功"elseecho "文件夹已经存在"fi

2020-08-12 10:49:40 9551

原创 Linux 使用unzip解压时报错End-of-central

Linux 下,使用unzip解压时,报错:$ unzip abc.zipArchive: abc.zip End-of-central-directory signature not found. Either this file is not a zipfile, or it constitutes one disk of a multi-part archive. In the latter case the central directory and zipfile com...

2020-08-07 15:58:35 17667

原创 Deep Multi-task Learning for Facial Expression Recognition 阅读笔记

分享一篇《Deep Multi-task Learning for Facial Expression Recognition and Synthesis Based on Selective Feature Sharing》,作者提出了一种带有卷积特征泄露单元的多任务网络结构,可以在面部表情识别任务和面部表情合成任务之间通过ConvFLU过滤掉无用和导致损害的特征的方式有选择地传递有益特征。并且使用面部表情合成分支来扩大和平衡训练数据集来提升网络的泛化能力。实验表明所提出的多任务网络在人脸表情图像的识别与

2020-08-05 10:58:06 344

原创 pytorch 去除pretrain model 最后一层或某一层

官方的pretrain model去除指定层可以参考链接https://blog.csdn.net/KHFlash/article/details/82345441,这里主要针对非官方的pretrain model,如下:import torchfrom collections import OrderedDictimport osimport torch.nn as nnimport torch.nn.init as initfrom xxx import new_VGGdef ini

2020-08-04 18:12:28 8780 1

原创 python 保存argparse中的配置参数

保存argparse配置参数重要的一步是将parser.parse_args()转换为字典,再输出key,value进行保存。示例如下:import argparseparser = argparse.ArgumentParser(description='test')parser.add_argument('--gpu_id', default=1, type=int)parser.add_argument('--size', default=32, type=int)parser.add

2020-07-31 10:27:19 17466

原创 FERSNet 阅读笔记

论文地址:https://arxiv.org/abs/2007.04514分享一篇《Deep Multi-task Learning for Facial Expression Recognition and Synthesis Based on Selective Feature Sharing》,作者提出了一种带有卷积特征泄露单元的多任务网络结构,可以在面部表情识别任务和面部表情合成任务之间通过ConvFLU过滤掉无用和导致损害的特征的方式有选择地传递有益特征。并且使用面部表情合成分支来扩大和平衡训

2020-07-14 17:28:20 177

原创 python list等分,并从等分的子集中随机选取一个数

有些时候我们需要从视频序列中均匀的随机采样,我们可以每隔x步进行一次采样,这就要求对一个list每隔x步进行一次截取,再从截取到的不同的子集中随机选取一个数就是我们平均采样的帧的idx。import randomdef split(a, n): k, m = divmod(len(a), n) return [a[i * k + min(i, m):(i + 1) * k + min(i + 1, m)] for i in list(range(n))]list_split =

2020-07-13 10:56:28 57156

原创 《Maximum Roaming Multi-Task Learning》阅读笔记

占坑

2020-07-02 09:43:14 129

原创 python 根据图片名称中的数字排序

import redef sort_key(s): #获取图片名称 tail = s.split('\\')[-1] # 匹配开头数字序号 c = re.findall('\d+', tail)[0] return int(c)def strsort(alist): alist.sort(key=sort_key) return alistimgs = strsort(['aa\\dghj_15.jpg','aa\\adj_105.jpg'.

2020-06-17 11:36:22 1461

原创 python opencv BGR2RGB转换原理

opencv bgr2rgb转换其实就是在Channel维度B通道和R通道互换:import numpy as npimg = np.arange(12).reshape((2,2,3))print(img)结果:[[[ 0 1 2] [ 3 4 5]] [[ 6 7 8] [ 9 10 11]]]img_ = img[:,:,::-1]print(img_)结果:[[[ 2 1 0] [ 5 4 3]] [[ 8 7 6] [1.

2020-06-17 11:29:26 19298

原创 python 判断一个数组所有值都在一个范围内

判断一个数组np.array([12,15,20])中所有的值是否都在(10,20)范围内import numpy as npar = np.array([12,15,20])print('original array: {}'.format(ar))if ((10<ar) & (ar<25)).all(): ar = np.array([25,25,25])print('new array: {}'.format(ar))结果:origin.

2020-06-17 11:14:46 7495 2

转载 train loss与test loss结果分析/loss不下降

train loss与test loss结果分析train loss 不断下降,test loss不断下降,说明网络仍在学习;train loss 不断下降,test loss趋于不变,说明网络过拟合;train loss 趋于不变,test loss不断下降,说明数据集100%有问题;train loss 趋于不变,test loss趋于不变,说明学习遇到瓶颈,需要减小学习率或批量数目;train loss 不断上升,test loss不断上升,说明网络结构设计不当,训练超参数设置不当,数据集经

2020-06-10 10:25:47 1410

原创 pytorch 多gpu并行训练

单机多卡并行训练torch.nn.DataParallel我一般在使用多GPU的时候, 会喜欢使用os.environ['CUDA_VISIBLE_DEVICES']来限制使用的GPU个数, 例如我要使用第0和第3编号的GPU, 那么只需要在程序中设置:os.environ['CUDA_VISIBLE_DEVICES'] = '0,3'这个参数最好在主体代码开始的时候写上,因为它要写在model调用cuda函数前使用。例如我们需要训练的文件为train.py,也是用‘0,3’号gpu,

2020-06-10 09:32:12 16665

原创 【简单理解】torch.nonzero(同样适用于获取tensor中某一元素的索引)

torch.nonzero其实就是找出tensor中非零的元素的索引import torchlabel = torch.tensor([[1,0,0], [1,0,1]])print(label.nonzero())返回的结果:tensor([[0, 0], [1, 0], [1, 2]])返回的结果就是非零元素的索引,其中[0,0]对应了第一行第一列的1,[1,0]对应了第二行第一列的1,[1,2]对应了第

2020-06-09 15:21:57 3654

原创 【2020更新】python 获取数据集的means和stdevs(均值、方差)

import numpy as npfrom tqdm import tqdmfrom glob import globimport cv2import randomimport osmeans = [0, 0, 0]stdevs = [0, 0, 0]index = 1num_imgs = 0imgslist = glob('/users/xxx/xxx/*.jpg')for imgpath in tqdm(imgslist): num_imgs += 1 im.

2020-06-09 12:07:04 478

原创 pytorch多gpu出现RuntimeError

记录一下使用多gpu出现的报错。在一开始的时候,使用的是单gpu能够正常训练和验证,但使用多gpu的时候就会报RuntimeError: shape '[xxx,xxx]' is invalid for input of size xxx错误,查找了一下原因并不是网络结构间的输入输出的shape不对应,而是train和val的batchsize应该都是gpu数量的整数倍。...

2020-06-08 14:56:14 1782 3

alexnet-owt-4df8aa71.pth

pytorch alexnet预训练模型,对应torchvision中的alexnet。有时候服务器下载会受到限制,可以下载到本地在转移到服务器上

2020-05-27

python2.7 dblib-18.17.100-cp27-none-win_amd64.zip

将dlib-18.17.100-cp27-none-win_amd64.whl放入D:\Anaconda2\Scripts文件夹(这个是我的anaconda2的目录)下,按Shift同时点鼠标右键弹出cmd命令框,输入pip install dlib-18.17.100-cp27-none-win_amd64.whl即完成安装。

2020-02-12

shape_predictor_68_face_landmarks_for_dlib.zip

Dlib's pre-trained predictor model for facial landmarks

2020-02-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除