自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

红叶谷 wsp_1138886114的博客

不想写了,佛系,躺平了...

  • 博客(19)
  • 资源 (27)
  • 收藏
  • 关注

原创 OpenCV—python OCR文本检测

文章目录一、形态学文本区域检测二、MSER+NMS文本区域检测2.1 MSER2.2 NMS一、形态学文本区域检测图像形态学操作,包括膨胀、腐蚀基本操作,即可实现简单场景的文字检测。其中,“膨胀”就是对图像中的高亮部分进行扩张,让白色区域变多;“腐蚀”就是图像中的高亮部分被蚕食,让黑色区域变多。通过膨胀、腐蚀的一系列操作,可将文字区域的轮廓突出,并消除掉一些边框线条,再通过查找轮廓的方法计算...

2019-08-31 22:55:29 8564 11

转载 python os、shutil 操作

文章目录OS 模块file 文件操作:shutil 操作:python中对文件、文件夹(文件操作函数)的操作需要涉及到os模块和shutil模块。OS 模块得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd()返回指定目录下的所有文件和目录名:os.listdir()函数用来删除一个文件:os.remove()删除多个目录:os.removedirs(r“c:...

2019-08-29 10:14:37 434

原创 OpenCV—Python 分水岭算法图像分割

文章目录一、前言二、cv2.distanceTransform(src, distanceType, maskSize)三、基于标记的分水岭分割功能四、示例代码一、前言分水岭算法是一种图像区域分割法,在分割的过程中,它会把跟临近像素间的相似性作为重要的参考依据,从而将在空间位置上相近并且灰度值相近的像素点互相连接起来构成一个封闭的轮廓,封闭性是分水岭算法的一个重要特征。其他图像分割方法,如阈...

2019-08-28 14:33:53 19356 5

原创 OCR文本检测模型—pixel_link

一、前言基于目标检测的文字检测模型:CTPN、SegLink、EAST等这些模型主要依赖于深度学习,可应用于自然场景中进行文字检测,其主要的实现步骤是判断是不是文本,并且给出文本框的位置和角度,如下图:现在:文字检测的经典模型:PixelLink(像素连接)只需要利用“分类”,就能实现对文本/非文本的判断,并同时给出文本框的位置和角度。github项目地址: https://github....

2019-08-26 13:32:07 2282 3

原创 linux 端口监听 Netstat 常用命令

文章目录一、Netstat二、Netstat 常用命令2.1 Linux 查看程序端口使用情况2.2 Linux查看程序端口占用情况三、Netstat 命令详情一、NetstatNetstat 是一款命令行工具,可用于列出系统上所有的网络套接字连接情况,包括 tcp, udp 以及 unix 套接字,另外它还能列出处于监听状态(即等待接入请求)的套接字。监听端口(列出所有端口,查看服务是否运...

2019-08-24 10:24:14 5816

原创 OCR文本检测模型—SegLink

文章目录一、SegLink模型的主要思想在自然场景中,例如灯箱广告牌、产品包装盒、商标等,要检测出其中的文字会面临着各种复杂的情况,例如角度倾斜、变形等情况,这时就需要使用基于深度学习的方法进行文字检测。该方法能在自然场景下较好地实现对文字的检测,但在CTPN中给出的文本检测效果是基于水平方向的,对于非水平的文本检测效果并不好,而在自然场景中,很多的文本信息都是带有一定的旋转角度的,例如用手机...

2019-08-23 22:29:01 2398

原创 OCR文本检测模型—EAST

文章目录一、EAST模型简介典型的文本检测模型一般是会分多个阶段(multi-stage)进行,在训练时需要把文本检测切割成多个阶段(stage)来进行学习,这种把完整文本行先分割检测再合并的方式,既影响了文本检测的精度又非常耗时,对于文本检测任务上中间过程处理得越多可能效果会越差。那么现在我们来学习又快、又准的检测模型。一、EAST模型简介本文介绍的文本检测模型EAST,便简化了中间的过...

2019-08-23 22:28:12 4238 1

原创 OCR文本检测模型—CTPN

文章目录一、CTPN简介二、CTPN检测流程三、小结一、CTPN简介一个简单的文字识别流程如下:Step 1. 通过手机、摄像机、扫描仪等设备采集含有待识别字符的图像,作为输入;Step 2. 对图像进行尺寸缩放、明暗调整、去噪等预处理操作;Step 3. 将图像中的单个字符、或者是连续几个字符所在的区域检测出来;Step 4. 根据文本检测结果从图像中将文本所在区域分割出来,然后导...

2019-08-23 22:27:22 2700

原创 OCR文本检测模型—Pixel-Anchor

文章目录一、文本检测概述二、Pixel-Anchor 网络详解2.1、Pixel-Anchor网络结构2.2、像素级别语义分割模块(Pixel based Module)2.3、锚检测回归模块(Anchor based Module)2.4、后处理2.5、Pixel-Anchor检测效果2.6、总结一、文本检测概述文本检测方法主要分为两类,这两种方法的优劣如下:基于像素级别的图像语义分割方...

2019-08-23 22:26:55 1939

原创 OCR综述—持续更新

整个OCR就是:文本检测、文本识别是其中两个关键环节目前OCR的应用场景主要分为以下三个方面:1、自然场景下多形态文本检测与识别2、手写体文本检测与识别3、文档的文本检测与识别(版面分析等)OCR目前的技术综述以及文献一、文本检测CTPN(基于Faster RCNN):目前比较成熟的文本检测框架,精确度较好。但是检测时间较长,有很大的优化空间。【文献】Detecting T...

2019-08-23 16:15:20 2041

原创 Tesseract-OCR 字库训练

一、环境搭建安装Tesseract-OCR自带下载中文字库进行识别!但是在实际使用识别效果不佳,为了提高识别效果所以决定根据所需要的识别的内容训练字库!字库的训练最好在Tesseract-OCR的安装目录下进行。1、下载Tesseract-OCR引擎:使用详情请点击。2、jTessBoxEditor 下载:https://www.softpedia.com/get/Multimedia/...

2019-08-23 16:02:39 2057 2

原创 Linux pip命令报错—ImportError报错

Linux pip命令报错 -bash: pip: command not found—ImportError:No module named XXX一、Linux pip命令报错 -bash: pip: command not found二、ImportError:No module named XXX一、Linux pip命令报错 -bash: pip: command not found...

2019-08-21 14:11:20 1020

原创 Linux-(zip,tar,rar,xz)压缩与解压

文章目录一、zip 压缩格式1.1 压缩常用命令1.2 解压常用命令二、tar 压缩格式2.1 压缩常用命令2.2 解压常用命令2.3 解压命令汇总2.4 XZ 压缩与解压三、rar 压缩格式四、关于tar更多详情一、zip 压缩格式命令格式:[user@localhost ~]$ zip [选项] 压缩包名 源文件或源目录1.1 压缩常用命令压缩文件:[user@localhos...

2019-08-19 16:23:35 2623

原创 OpenCV—python 简单的图像质量检测

写这个主要是为了提高OCR识别率,筛选出图像质量极差的二值图返回不识别,只识别质量高一点的二值图,灰度图以及RGB图片。统计以下:'白底方差', '图案方差', '像素波动方差','图像大小/分辨率' 这几个参考因素,若是像素波动方差小于1,图像大小/分辨率小于0.01,则是质量极差的图片了。import cv2,os,csvimport numpy as npdef get_img(...

2019-08-18 10:55:19 4748 5

原创 Numpy 中排序统计函数(argsort,bincount)

1. argsort,argmax与argmin.sort就是排序,argsort就是返回排序前数字的索引。argmax与argmin.:一个返回最大值的索引,一个返回最小值的索引。import numpy as npc = np.array([1,2,5,9,3])print('输出排序结果:',np.sort(c))print('输出排序前索引:',np.argsort(c))...

2019-08-18 09:49:42 404

转载 CNN模型大综述

文章目录一、主要的分类CNN网络:Backbone1.1 LeNet51.2 Dan Ciresan Net1.3 AlexNet1.3.3 AlexNet的衍生1.4 ZFNet1.5 VGG-16/VGG-191.6 NIN网络1.7 GoogLeNet - inception1.7.1 [网络结构](https://www.zybuluo.com/rianusr/note/1419006)i...

2019-08-13 15:20:47 1900

原创 Python 与 Matlab 矩阵操作对应表

文章目录Matlab、python函数对应表MATLABMatlabPythonnumel(X)X.sizesize(X, 2)X.shape[1]A.*BA*BA*BA.dot(B)X’X.conj().TX(1:5, :)X[0:5, :]X(1:2, 4:7)X[0:2,3:7]repmat(X, 2, 3)np...

2019-08-06 14:11:54 2794

原创 linux ps进程查看与杀死

ps命令查找与进程相关的PID号:ps a 显示现行终端机下的所有程序,包括其他用户的程序。ps -A 显示所有程序。ps c 列出程序时,显示每个程序真正的指令名称,而不包含路径,参数或常驻服务的标示。ps -e 此参数的效果和指定"A"参数相同。ps e 列出程序时,显示每个程序所使用的环境变量。ps f 用ASCII字符显示树状结构,表达程序间的相互关系。ps -H 显...

2019-08-02 15:38:11 816 1

原创 linux查看硬件配置命令

文章目录硬件查看命令cat /proc/cpuinfo 分析输出硬件查看命令系统  # uname -a # 查看内核/操作系统/CPU信息  # head -n 1 /etc/issue # 查看操作系统版本  # cat /proc/cpuinfo # 查看CPU信息  # hostname # 查看计算机名  # lspci -tv # 列出所有PCI设备  # lsusb ...

2019-08-02 15:25:02 13792 6

goturn-files.7z

模型文件:GOTURN模型–视频对象跟踪模型 使用方法查看文档:https://wangsp.blog.csdn.net/article/details/120260258

2021-09-17

google_class.7z

模型文件:GoogleNet数据模型为例,实现对图像常见分类模型支持1000种常见图像分类模型 使用方法查看文档:https://wangsp.blog.csdn.net/article/details/120260258

2021-09-17

face_detector_检测模型.7z

使用tensorflow的人脸检测模型:模型文件与配置文件。 使用方法查看文档:https://wangsp.blog.csdn.net/article/details/118732135

2021-09-17

华为通用表格识别格式化成excel

调用华为OCR通用表格后,将批量json文件转成excel。里面包含文件(demo_01.py,huawei_table2excel..so,huawei_table2excel.pyd)一个是win平台,一个是linux平台

2020-03-20

LC算法python实现.zip

里面共三个文件:demo_LC.cp36-win_amd64.pyd;readme.txt;test.py。使用方法在readme文件中。 源代码:https://blog.csdn.net/wsp_1138886114/article/details/102966403 参考代码:https://blog.csdn.net/wsp_1138886114/article/details/102560328

2019-11-08

psf2otf_circShift函数.zip

这是psf2otf的python实现方法。关于详情请查看文章:https://blog.csdn.net/wsp_1138886114/article/details/95024180。

2019-07-23

CT肺结节权重和临时数据

包含权重文件:unet.hd5;3dcnn.hd5。和处理的临时文件temp_dir

2019-02-19

基于RFM模型实现的零售精准营销响应预测系统代码

包含4个文件:1_从交易数据中提取RFM特征.ipynb,2_客户RFM分析.ipynb,3_响应预测模型训练和选择.ipynb,4_模型部署和应用.ipynb

2019-02-15

基于RFM模型实现的零售精准营销响应预测系统数据

基于RFM模型实现的零售精准营销响应预测系统数据:Retail_Data_Response.csv:customer_id,response Retail_Data_Transactions.csv:customer_id,trans_date,tran_amount

2018-11-01

爬虫获取的数据,一些可能能用的ip地址,化学品供应信息

主要是python 爬虫获取的数据。包括化学品供应信息.xls和西刺网站IP地址.xls 如有需要的话,请下载

2018-10-20

文本识别opencv-text-recognition

该压缩包主要包含文件:测试用的图片images,以及已经训练好的权重frozen_east_text_detection.pb,及运行代码:text_recognition.py

2018-10-16

ml-100k-ALS推荐算法数据集

该数据集为公共数据集:主要有u.data,u.genre,u.info,u.item,u.user,u.occupation 等文件

2018-09-21

工业生产流程的数据分析预测

工业故障智能预测:使用随机深林进行预测。含有:testA_suzhou,train_suzhou,测试A_20180117,测试B_20180117,训练_20180117等数据和模型代码

2018-08-29

基于聚类(Kmeans)算法实现客户价值分析系统(电信运营商)

基于聚类(Kmeans)算法实现客户价值分析系统(电信运营商)包含(custinfo.csv,custcall.csv以及输出的数据集result,还有图片)

2018-08-20

基于聚类(Kmeans)算法实现的客户价值分析系统data

基于聚类(Kmeans)算法实现的客户价值分析系统(包含custcall,custinfo,result,tariff,国内某航空公司会员数据)等数据信息

2018-08-18

基于NLP自然语言构建的文档自动分类_test_data _stopwords

对爬取的搜狐文档数据进行自动分类,主要有“体育,健康,房地产,娱乐,女人,文化,新闻”等文章类别,为测试数据和停用词

2018-08-18

基于NLP自然语言构建的文档自动分类系统_data

对爬取的搜狐文档数据进行自动分类,主要有“体育,健康,房地产,娱乐,女人,文化,新闻”等文章类别,已经标记好为训练数据

2018-08-18

贝叶斯模型LDA贝叶斯算法实现的电商行业商品评论与情感分析案例

LDA贝叶斯算法实现的电商行业商品评论与情感分析案例,数据集主要涉及‘美的’品牌的评论

2018-08-15

从新闻网站点击流中挖掘

从新闻网站点击流量中挖掘 在新闻网站上,一个会用户不断点击和浏览各种新闻报道,最终该用户的这些点击会被记录下来,成为该用户点击的历史记录。而所有用户的点击历史记录,是一个蕴含了巨大价值的数据集。

2018-08-15

卷积神经网络实现数字识别数据

卷积神经网络实现数字识别数据集,主要有t10k-images.idx3-ubyte,t10k-labels.idx1-ubyte,train-images.idx3-ubyte,train-labels.idx1-ubyte四个数据集

2018-08-14

基于Kaggle的经典AI项目——数据集

基于Kaggle的经典AI项目——数据集: 含有如下字段 MSZoning: String, // 房屋类型:农用,商用等 LotFrontage: String, // 距离街道的距离 LotArea: String, // 房屋的面积

2018-08-09

shape_predictor_68_face_landmarks和dlib

shape_predictor_68_face_landmarks用于标定脸部68个特征点和dlib库

2018-08-08

预测Titanic号上的乘客生存概率-数据集

预测Titanic号上的乘客生存概率-数据集,训练集,测试集,预测结果

2018-08-08

Pandas——练习题一:在校生饮酒消费数据分析

Pandas—练习题一:在校生饮酒消费数据分析。主要用于pandas的函数操作练习

2018-07-25

Pandas——练习题二——数据集

博客中Pandas练习题数据集。user数据集与chipotle.csv数据集

2018-07-25

pandas+matplotlib习题数据集

博客中pandas+matplot习题数据集,主要是关于pandas的数据处理操作

2018-07-23

pyspark_ml_pipeline_DecisionTreeClassifier_RF数据集

pyspark_ml_pipeline_DecisionTreeClassifier_RF数据集(day.csv/flights.csv/hour.csv/test.tsv/u.data/wc.data)

2015-06-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除