![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python
文章平均质量分 62
非 常 道
这个作者很懒,什么都没留下…
展开
-
python AES对称加密文件、解密文件
咱也不是学计算机的,咱也不是学网络安全的,咱更不是学密码学的,所以东拼西凑一堆代码,能用就行。该加解密的秘钥是自己输入的密码加电脑固定序列号,包括网卡MAC地址、CPU序列号、硬盘序列号、主板序列号、BIOS序列号。这样可以保证加密文件只能在加密时的计算机打开,在其他人的计算机无法打开,不想用这个功能的可以在生成秘钥那里把序列号删掉。序列号的获取参考我写的这篇文章:https://blog.csdn.net/weixin_42845306/article/details/114899172我下面的原创 2021-03-20 03:20:13 · 1169 阅读 · 0 评论 -
python wmi读取网卡MAC地址、CPU序列号、硬盘序列号、主板序列号、BIOS序列号
序列号相当于电脑的身份证号,是硬件出厂时,厂商写在硬件里的唯一识别码,具有唯一性和不可修改性。很多正版软件以此来识别用户电脑,限制安装。原创 2021-03-16 20:39:12 · 2195 阅读 · 0 评论 -
PaddlePaddle Degug之ImportError: DLL load failed while importing pyclipper: 找不到指定的模块。
问题背景:为了打标签制作数据集,我给朋友装paddle环境,奈何启动打标签工具的时候报错。错误如下:问题的一般解决方法:对于身经百战的程序员,这种错误见得多了,反手就是一个:pip uninstall pyclipper接着就是一个pip install pyclipper然而错误还是没有解决,看了一下包,发现这个问题:大概意思就是:用户:安装pyclipper包。程序:包安好了。用户:看看安装成功没?程序:包状态良好,版本1.2.1。用户:把包导入。程序:找不到指定的模块。网上原创 2021-03-06 16:39:24 · 1975 阅读 · 9 评论 -
PaddlePaddle飞桨OCR文本检测——更改模型保存间隔(六)
先看配置文件中关于保存的参数epoch_num: 总的训练轮数print_batch_step: 每隔多少个batch打印一回信息save_model_dir: 模型保存路径save_epoch_step: 模型保存时间间隔,以epoch计eval_batch_step: 在第0个batch后每隔500个batch评估一次后面还有batch_size_per_card: 每个batch运行的图片数,过多会爆显存模型训练总共epoch_num个epoch,每个epoch会把所有图片都跑一遍,原创 2021-03-04 23:31:06 · 3657 阅读 · 3 评论 -
PaddlePaddle飞桨OCR文本检测——识别图片文字结果并保存为txt(五)
此部分只考虑rec识别部分,不考虑检测和方向分类。举个栗子,要识别的图片如下所示:这是paddle自带的图片,也是det检测后的框出来的图片,可以看到,rec识别部分的输入图片,是仅有一行文字,没有其它乱七八糟的东西,也没有多余的空白,非常精炼。在PaddleOCR-dygraph根目录下启动cmd,输入识别图片代码如下:python tools/infer_rec.py -c configs/rec/ch_ppocr_v2.0/rec_chinese_common_train_v2.0.yml原创 2021-02-17 12:28:54 · 9409 阅读 · 13 评论 -
PaddlePaddle eval后报错terminate all the procs的解决方法
问题背景:用paddle做ocr识别训练,每隔一段时间后的训练,会自动评估(eval)一次,之前都好好的,训练一整晚都不会报错。结果打美赛打了5天之后再弄,就出现了一些奇奇怪怪的错误。问题重述:问题简洁明了,发生在评估之后,直接告诉你0号显卡进程终止。没有任何错误提示。就连log里面也没写什么有用的东西。模型建立:解决之路:最开始怀疑是用了LMDB数据集的问题,重新用回了简单数据集,还是报错。怀疑是数据集出bug了,换了个少一点的测试集,问题没能解决。美赛期间安装了很多python库,怀原创 2021-02-10 13:43:10 · 706 阅读 · 0 评论 -
PaddlePaddle飞桨OCR文本检测——检测模型测试与评估(平均准确率、平均召回率、修改交并比IOU)(四)
接上一篇:检测模型训练(二)PaddlePaddle环境的构建详见专栏内其他文章。本文使用MobileNetV3_large_x0_5_pretrained预训练检测模型,评估该检测模型在icdar2015上的检测效果。icdar2015检测数据集如上图所示。首先修改配置文件,文件路径如下图所示这是MobileNetV3_large_x0_5_pretrained模型的配置文件,如果用的是其他模型,请使用其他的.yml配置文件。打开.yml配置文件,在Architecture标签下可以看到原创 2021-01-31 14:28:23 · 5420 阅读 · 1 评论 -
python制作印刷体数据集:数字符号数据集(字符串转图片)
做OCR项目,需要有很多印刷体的数据集,靠人工手动截图标注显然不现实,于是“人生苦短,我用python”思路:数据集分两类,一类是长浮点数,模拟财务报表中的上亿元金额:比如799,889,565.24实验证明,识别模型经常把最后的小数点识别成,还有一类就是随机的各种数字以及符号混合生成完之后用pycharm的库将文本转为图片,把标签信息按格式写入label.txt中。为了模拟扫描件效果,用opencv再打开,作图片(微小的)旋转,再保存。最后的图片锐化处理模拟扫描(这个另讲)和数据集处理。上原创 2021-01-28 10:26:45 · 2850 阅读 · 7 评论 -
python批量从pdf中转换图片保存
做项目,需要对公司财报做OCR,首先数据集,就得从财报pdf中截取图片了。import datetimeimport osimport fitz # fitz就是pip install PyMuPDFdef pyMuPDF_fitz(pdfPath, imagePath,i): # PDF路径 保存图片路径 PDF编号 startTime_pdf2img = datetime.datetime.now() # 开始时间 # print("imagePath=" + ima原创 2021-01-19 17:44:29 · 1116 阅读 · 0 评论 -
python爬虫——批量爬取百度图片
最近做项目,需要一些数据集,图片一张一张从网上下载太慢了,于是学了爬虫。首先打开命令行,安装requests库pip install requests百度图片搜索的链接如下:url='http://image.baidu.com/search/index?tn=baiduimage&fm=result&ie=utf-8&word='#百度链接不信你在=后面加上要搜索的关键字,放在浏览器里试试。下面分析一波百度图片,随便搜点什么东西,在浏览器里按F12打开开发者模式:原创 2021-01-18 17:53:59 · 3150 阅读 · 7 评论 -
python制作词云图
词云图,文本字体的大小表示文本出现的频率,很直观。废话不说,上代码:import numpy as npfrom PIL import Imageimport osfrom os import pathfrom wordcloud import WordCloud,STOPWORDS,ImageColorGeneratorfrom matplotlib import pyplot as pltfrom matplotlib.pyplot import figure,show,rcd=pat原创 2021-01-17 12:45:13 · 1346 阅读 · 2 评论 -
PaddlePaddle飞桨OCR文本检测——识别模型训练(三)
上一篇检测模型训练https://blog.csdn.net/weixin_42845306/article/details/112689152飞桨的OCR模型分为检测、识别和分类,今天讨论识别。ORC的识别,就是给定一张剪辑好的图片,这个图片只有一串纯文本,计算机将图片里的内容识别出来。要识别的图片:OCR的识别和目标识别差不多,都是把猫的图片识别成猫,狗的图片识别成狗数据集准备进入正题自定义图片标注的方法上一篇讲过,产生的文件包含一个充满了图片的文件夹crop_img和对应的识别标签r原创 2021-01-16 23:41:01 · 6172 阅读 · 13 评论 -
PaddlePaddle飞桨OCR文本检测——检测模型训练(二)
飞桨的OCR模型分为检测、识别和分类,先看检测。检测就是将(可能的)文本标定好坐标,简单说就是给图中的文本画框。数据集制作及图片标注首先制作训练集,找很多带文字的图片,放在一个文件夹里(这里叫img_50),注意图片的名字。虽说可以任意,但最好还是得有规律。然后是标定标签,方法有很多,这里用自带的PPOCRLabel,用法这里有详细介绍:https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/PPOCRLabel/README_ch.md大原创 2021-01-15 23:15:08 · 11748 阅读 · 14 评论 -
PaddlePaddle飞桨OCR文本检测——入门安装GPU版(一)
首先放上github上的开源代码网址,里面的帮助文档说的非常详细:https://github.com/PaddlePaddle/PaddleOCR/环境安装python中环境使用pip安装:在cmd里输入以下代码:python -m pip install paddlepaddle-gpu==2.0.0rc1 -i https://mirror.baidu.com/pypi/simple本人python版本3.7.3可以正常安装,后面的链接是百度自己的镜像源,下载速度飞快。从最上面的Git原创 2021-01-15 22:21:59 · 11607 阅读 · 9 评论 -
PaddleOCR文字识别使用
【转载】原网页:https://github.com/PaddlePaddle/PaddleOCR/简介PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力使用者训练出更好的模型,并应用落地。注意PaddleOCR同时支持动态图与静态图两种编程范式动态图版本:dygraph分支(默认),需将paddle版本升级至2.0rc1+(快速安装)静态图版本:develop分支近期更新2021.1.4 FAQ新增5个高频问题,总数142个,每周一都会更新,欢迎大家持续关注。2转载 2021-01-15 10:46:45 · 4066 阅读 · 2 评论 -
使用Python合成gif动图
下载地址:链接:https://pan.baidu.com/s/1F_UcK-LUzorw182MzYh6pw提取码:al3m通常来说,图片比文字更有说服力,所以论文中图片有非常重要的地位。然而以gif为代表的动图会比单个静态图片更能展示成果,尽管没法放在论文中,可以把多张图片钉在一起快速翻页 ,gif在ppt展示中和表情包制作 中仍大有可为。为了能在通信原理大作业展示中拿高分,我打算将不同截止频率的滤波器滤波结果合成成一张gif,应该是一个简单的工作,然而上网一搜,这个简单的工作居然还要花钱!原创 2021-01-07 16:25:07 · 883 阅读 · 0 评论