Pywin-CSDN博客

原创 OCR手写字体生成数据

简述：根据CASIA的HWDB1.X的手写字符生成了一些带有字符级标注、行级别标注的文本数据，分享给需要的同学。生成基于不同人的字体、字体大小、行间字体间隔、旋转角度、文本布局的文字贴图。生成素材：共65种贴图背景，由420位手写字体作者完成的71,122个符号，1,609,136个汉字/3,866类。数据量：Train:2597张， Test：662张，目前完了HWDB1.0部分，part2，part3如果需要后期可以继续制作。字符素材：数据示例：...

2020-10-29 19:14:36 12561 1

原创 CASIA-HWDB2.x（offline）数据集合并为page类型，并标出行级别的bbox

最近要做行级别的手写文件检测工作，将CASIA-HWDB2.x（offline）数据进行合并，生成了page level的数据集，还带有相应的bbox。如果大家想交流ocr相关的工作可以加群（文章末尾）：CASIA-HWDB2.x（offline）数据集下载地址：http://www.nlpr.ia.ac.cn/databases/handwriting/Download.html我所下载的是这一部分：CASIA-HWDB2.x（offline）数据集解析可以参考：https://www.f

2020-09-30 11:05:53 13084 10

原创 YOLOV3网络模型

YOLOV3

2022-02-28 23:08:31 2490 1

原创 YOLOV2网络模型

yolov2网络模型

2022-02-23 10:14:30 13609 5

原创 NMS非极大值抑制算法原理

NMS非极大值抑制算法

2022-02-22 15:46:08 3357

原创 YOLOV1网络模型

YOLOV1

2022-02-22 15:30:12 3522

原创 Global Convolutional Network(GCN)网络模型

Global Convolutional Network

2022-02-18 17:13:18 2556

原创 MobileNetV1&MobilenetV2模型

mobilenetV1 mobilenetV2 模型框架

2022-02-17 20:57:23 2984

原创【详细】python打包exe文件，pycharm+pyinstaller打包成功

pyinstaller， python，带资源一起打包成exe文件

2022-02-16 14:40:44 5025

原创 ResNet18、50模型结构

resnet18和resnet50模型结构

2022-02-11 16:49:44 17416

原创 python opencv 已知图片和mask，抠出mask区域

目录前言：目标：思路：完整代码：前言在ICDAR2021竞赛中，需要取出图片中需要分割的样本，对样本进行仿射变换，背景替换，生成更丰富的样本。目标结合mask取出input中的两张卡片 input mask ...

2021-07-01 11:31:25 8448 7

原创 python opencv 利用鼠标点击事件移除标记区域

上图中左边的图是需要进行移除正方形上的多边形，右图是移除后的结果。操作也比较简单，使用鼠标在多边形外围点击四下就可以移除该区域了，鼠标点击用左图红色圆圈表示。具体实现如下代码：#-*- coding:utf-8 -*-import cv2import pandas as pdimport numpy as npimport os...

2021-04-26 16:18:43 716 1

原创 linux 复制除某个文件夹外所有的文件

例如root/file/ 目录下有data、train.py、inference.py、utils等文件或文件夹，要复制除data文件夹以外所有的文件到copy_file目录下先进入要复制的root/file/ 目录下，执行以下命令：cp -r `ls |grep -v data|xargs` ../copy_file/...

2021-03-16 11:29:48 12437 1

原创 pip错误 ImportError: No module named ‘pip‘

今天在使用pip的时候，发现问题，ImportError: No module named 'pip' 。anaconda下只有一个版本的python：使用一下代码，重新激活pip。2.7版本：curl https://bootstrap.pypa.io/pip/2.7/get-pip.py -o get-pip.py3.5版本：curl https://bootstrap.pypa.io/pip/3.5/get-pip.py -o get-pip.py3.5+版本.

2021-03-11 14:22:28 3895 1

原创根据两个矩形顶点坐标判断两个矩形是否相交

def is_intersect(coord1, coord2): crd_min_x = min(np.array(coord1).flatten()[0::2]) crd_max_x = max(np.array(coord1).flatten()[0::2]) crd_min_y = min(np.array(coord1).flatten()[1::2]) crd_max_y = max(np.array(coord1).flatten()[1::2]) #.

2021-03-03 10:07:14 847

原创启动jupyter

win键-->输入cmd-->jupyter notebook

2021-02-18 09:58:05 307

原创 numpy选择没有零的行

import numpy as npdata = np.array([[1, 2, 3, 4], [0, 0, 3, 4], [5, 6, 7, 8], [9, 9, 1, 0]])result = data[np.all(data, axis=1)]结果：[[1 2 3 4] [5 6 7 8]]

2020-12-22 09:29:32 849

原创给定一个list的set及set中元素被选取的概率，从list中按set元素的概率抽取若干个数

import randomimport numpy as npa = list(range(0, 9)) #a = [0,1,2,3,4,5,6,7,8]a_ = list(range(0, 10)) #a_ = [0,1,2,3,4,5,6,7,8,9]b = a * 5 + [9] * 2 #b = [0,1,2,3,4,5,6,7,8,...,9,9]random.shuffle(b)p1 = (1/5) / ((1/5)*9 + (1/2))p2 = (1/2) / (.

2020-11-25 15:01:12 693

原创 python opencv 将两张图以一定的透明度融合

先上结果：图1：图2：融合结果：代码：#-*- coding:utf-8 -*-import cv2import numpy as npimport randomimport osif __name__=='__main__': bg_path = r'G:\PAdatasets\openDatasets\OCR\collectOcrData\high_resolution_img' pages_path = r'G:\check\ocr\hc

2020-11-05 17:20:40 17605

原创 python opencv 分别取出图像中黑白部分

将图片中的黑白部分分别提出来需要用到cv2.threshold(src, thresh, maxval, type)函数，其中参数分别表示为：src：表示的是图片源 thresh：表示的是阈值（起始值） maxval：表示的是最大值 type：表示的是这里划分的时候使用的是什么类型的算法**，常用值为0（cv2.THRESH_BINARY）**示例：syn_img = cv2.imread(r'xxx.jpg')#小于220，赋值为255，其他值为0_, syn_binary_i

2020-11-05 15:29:42 20201

原创多进程保存图片，不报错但未保存成功

先上有问题的代码：import multiprocessingimport timeimport cv2import osdef run(ts): img = cv2.imread(r'E:\untitled2\Company\hccr\example\rotate.jpg') cv2.imwrite(os.path.join(root, 'img_{}.jpg'.format(ts)), img) print("end")if __name__ == "__ma

2020-10-26 15:07:45 612

原创 GazeBase

《GazeBase: A Large-Scale, Multi-Stimulus, Longitudinal Eye Movement Dataset》下载地址：https://figshare.com/articles/Raw_data/12912257GazeBase is a large-scale longitudinal dataset consisting of 12,334 monocular (left) eye-movement recordings captured from 3

2020-09-17 09:43:38 668

原创【简单】torch.sactter_(),一遍看懂

看了一大堆的博客，有的博客几乎是照搬别人的博客，没啥意义。另一些个人感觉写得没有抓住本质。最常见的官方示例：>>> x = torch.rand(2, 5)>>> x 0.4319 0.6500 0.4080 0.8760 0.2355 0.2609 0.4711 0.8486 0.8573 0.1029[torch.FloatTensor of size 2x5]>>> torch.zeros(3, 5).sc.

2020-09-14 18:13:33 323 1

原创去除字符串中的引号

#第一种，只去除两边的引号，保留中间字符的引号def my_strip(str, char): if str[0] == char:str = str[1:] if str[-1] == char:str = str[:-1] return strst1 = '"csdn csdn,"csdn""'st_rm1 = my_strip(st1, '"')print(st_rm1)#结果：csdn csdn,"csdn"#第二种，去除所有的引号import re.

2020-09-04 14:50:37 22130

原创 shell 创建文件夹

#!/bin/bashdir="/root/test_dir"if [ ! -d "$dir" ];thenmkdir $direcho "创建文件夹成功"elseecho "文件夹已经存在"fi

2020-08-12 10:49:40 18549

原创 Linux 使用unzip解压时报错End-of-central

Linux 下，使用unzip解压时，报错：$ unzip abc.zipArchive: abc.zip End-of-central-directory signature not found. Either this file is not a zipfile, or it constitutes one disk of a multi-part archive. In the latter case the central directory and zipfile com...

2020-08-07 15:58:35 20194 1

原创 Deep Multi-task Learning for Facial Expression Recognition 阅读笔记

分享一篇《Deep Multi-task Learning for Facial Expression Recognition and Synthesis Based on Selective Feature Sharing》，作者提出了一种带有卷积特征泄露单元的多任务网络结构，可以在面部表情识别任务和面部表情合成任务之间通过ConvFLU过滤掉无用和导致损害的特征的方式有选择地传递有益特征。并且使用面部表情合成分支来扩大和平衡训练数据集来提升网络的泛化能力。实验表明所提出的多任务网络在人脸表情图像的识别与

2020-08-05 10:58:06 809

原创 pytorch 去除pretrain model 最后一层或某一层

官方的pretrain model去除指定层可以参考链接https://blog.csdn.net/KHFlash/article/details/82345441，这里主要针对非官方的pretrain model，如下：import torchfrom collections import OrderedDictimport osimport torch.nn as nnimport torch.nn.init as initfrom xxx import new_VGGdef ini

2020-08-04 18:12:28 12419 1

原创 python 保存argparse中的配置参数

保存argparse配置参数重要的一步是将parser.parse_args()转换为字典，再输出key，value进行保存。示例如下：import argparseparser = argparse.ArgumentParser(description='test')parser.add_argument('--gpu_id', default=1, type=int)parser.add_argument('--size', default=32, type=int)parser.add

2020-07-31 10:27:19 19711

原创 FERSNet 阅读笔记

论文地址：https://arxiv.org/abs/2007.04514分享一篇《Deep Multi-task Learning for Facial Expression Recognition and Synthesis Based on Selective Feature Sharing》，作者提出了一种带有卷积特征泄露单元的多任务网络结构，可以在面部表情识别任务和面部表情合成任务之间通过ConvFLU过滤掉无用和导致损害的特征的方式有选择地传递有益特征。并且使用面部表情合成分支来扩大和平衡训

2020-07-14 17:28:20 405

原创 python list等分，并从等分的子集中随机选取一个数

有些时候我们需要从视频序列中均匀的随机采样，我们可以每隔x步进行一次采样，这就要求对一个list每隔x步进行一次截取，再从截取到的不同的子集中随机选取一个数就是我们平均采样的帧的idx。import randomdef split(a, n): k, m = divmod(len(a), n) return [a[i * k + min(i, m):(i + 1) * k + min(i + 1, m)] for i in list(range(n))]list_split =

2020-07-13 10:56:28 57670

原创《Maximum Roaming Multi-Task Learning》阅读笔记

占坑

2020-07-02 09:43:14 292

原创 python 根据图片名称中的数字排序

import redef sort_key(s): #获取图片名称 tail = s.split('\\')[-1] # 匹配开头数字序号 c = re.findall('\d+', tail)[0] return int(c)def strsort(alist): alist.sort(key=sort_key) return alistimgs = strsort(['aa\\dghj_15.jpg','aa\\adj_105.jpg'.

2020-06-17 11:36:22 2420

原创 python opencv BGR2RGB转换原理

opencv bgr2rgb转换其实就是在Channel维度B通道和R通道互换：import numpy as npimg = np.arange(12).reshape((2,2,3))print(img)结果：[[[ 0 1 2] [ 3 4 5]] [[ 6 7 8] [ 9 10 11]]]img_ = img[:,:,::-1]print(img_)结果：[[[ 2 1 0] [ 5 4 3]] [[ 8 7 6] [1.

2020-06-17 11:29:26 21603

原创 python 判断一个数组所有值都在一个范围内

判断一个数组np.array([12,15,20])中所有的值是否都在（10，20）范围内import numpy as npar = np.array([12,15,20])print('original array: {}'.format(ar))if ((10<ar) & (ar<25)).all(): ar = np.array([25,25,25])print('new array: {}'.format(ar))结果：origin.

2020-06-17 11:14:46 10366 2

转载 train loss与test loss结果分析/loss不下降

train loss与test loss结果分析train loss 不断下降，test loss不断下降，说明网络仍在学习;train loss 不断下降，test loss趋于不变，说明网络过拟合;train loss 趋于不变，test loss不断下降，说明数据集100%有问题;train loss 趋于不变，test loss趋于不变，说明学习遇到瓶颈，需要减小学习率或批量数目;train loss 不断上升，test loss不断上升，说明网络结构设计不当，训练超参数设置不当，数据集经

2020-06-10 10:25:47 1875

alexnet-owt-4df8aa71.pth

shape_predictor_68_face_landmarks_for_dlib.zip

python2.7 dblib-18.17.100-cp27-none-win_amd64.zip

空空如也