文本篡改检测识别与OCR
文章平均质量分 88
文本文档类篡改检测识别以及OCR相关内容
Kun Li
自古山高水远路,无一不为风尘苦。
展开
-
工业检测 ocr
好,转入正题:]原始需求:系统将使用手机等设备利用光学字符识别技术实现钻具编号自动识别,减少作业人员的工作量隐含分析:对场景本身来说,要进行人工核对(或者修改)是必不可少的,因此工作量未必是减少。角钢字符检测和识别设备主要用于钢印的字符检测和识别,可应用于电网铁塔角钢的检测设备,以及各种钢材生产加工设备需要字符检测和识别的应用场景,有助于设备生产加工过程的信息化处理、MES系统的对接等。1、图像输入:进行图像识别,首先采集的图像可以是名片、身份证、护照、驾照、驾照、公文、证件等,然后输入图像 到识别核心。原创 2023-09-17 15:46:11 · 630 阅读 · 0 评论 -
智能批改预研
2.采集的试卷除了硬件辅助和墨水屏这种采集设备,一般的诸如拍照和手机拍照,都要设计关键点矫正,答题区域检测,手写体ocr识别等技术,只有生成的有规范的答题卡或者试卷在试卷定位这块才比较好做,且都需要人工进行审核,只能说大幅度减轻批改压力,但全自动化有压力。最近接触的教育ocr的项目不少,很多都是刚需项目,主要集中在检测识别这块,有从试卷生成到批改入库的,有支持任意格式试卷批改入库的,总体来说,如何对试卷答题区域进行识别和智能批改这块是最关键的,采集端更加智能化和规范化,未作答批改,分步骤批改,应用提批改。原创 2023-07-25 11:38:36 · 204 阅读 · 0 评论 -
隐写分析steganography
隐写分析也是一个比较常见的需求,有传统和深度学习方法两条线路。我尝试了上面这两个库,效果还是很好的,支持中英文隐写,基本原理和方法包括lsb等。原创 2023-01-10 11:07:22 · 587 阅读 · 0 评论 -
ocr票据证件信息抽取正则化
目录一、前言二、函数原型三、使用案例1.匹配单个数字或字母2.匹配多个数字或字母3.匹配其他四、致谢一、前言在字符串数据处理的过程中,正则表达式是我们经常使用到的,python中使用的则是re模块。下面会通过实际案例介绍 re.sub() 的详细用法,该函数主要用于替换字符串中的匹配项。https://blog.csdn.net/qq_36556893/article/details/89182067目录 一、re.findall函数介绍 二、代码如下 三、re.findall中正则表达式(.*?原创 2023-01-09 17:26:53 · 606 阅读 · 0 评论 -
RGB转频域分析
转频域的方法一般有三种,dft,dct,dwt.频域一般是在压缩中使用,可以减少图片中冗余信息,保留有用信息,明确一点就是去除部分低频信息,保留高频信息,高频信息一般指的是边缘等,加上高频之后,图像会变的更加尖锐。dct要比dft好很多,直观看dft确实很难表征篡改侧的特征。0.前情回顾CNN大家在计算机视觉中运用得已经非常多了,一般认为CNN提取特征是循序渐进的,开始提取 low-level的特征,比如边缘、纹理,中间提取 middle-level的特征,最后提取更加抽象的 high-level的特征。原创 2022-09-07 15:53:18 · 1707 阅读 · 0 评论 -
mantranet:manipulation tracing network for detection and localization of image forgeries
文中有关于这么设计的思路,首先特征提取层是一个vgg16,后面接一个local anomaly detection network,最后还是bce loss,算是标准的语义分割问题,不过也讨论了BayerConv2d是一种约束卷积层的方式,可以抑制图像痕迹的影响,自适应提取图像的篡改特征。这些属于在结构上的优化设计,在后续的天池的篡改比赛中,在文档场景也有提出了这些clue设计的滤波器其实是效果不太好的,并不能针对特定场景有比较好的效果。写的其实挺好的,有两个点。原创 2022-09-05 16:39:02 · 1067 阅读 · 0 评论 -
RGBN:Learning Rich Features for Image Manipulation Detection
RGBN是一个比较有意义的开创性工作,不过现在回头来看,其实也还好,它主要在自己造的数据上训练,本文也阐述了图像篡改检测和显著性检测的不同,篡改检测希望学到更加丰富的特征,我自己理解,文本篡改检测不仅要到文本的粒度,更要去检测文本中异常的样本,它其实要更加细粒度一些。有的时候也确实需要多给一些先验才能很好的处理,不然就多加一些数据,只不过加数据可能存在目标样本分布和造的样本分布存在差异的情况,这种情况其实也不利于应用。此外SRM也没有使用30个channel,而是只用了3个滤波器,作者实验说了效果也很好。原创 2022-09-01 19:19:29 · 1869 阅读 · 0 评论 -
A deep learning approach to detection of splicing and copy-move forgeries in images
这篇文章的代码我跑过,本身还是有效果的,其中它里面数据预训练的分patch操作也在后续中被引进,但说实话,这种简单的网络设计其实跑不过不做任何设计的分类模型,比如res2net。篡改检测常用的基本都是自然场景数据集,比如CASIA1/2,中科院出的数据集,还有BHSig60,COVERAGE,NC16等,这些数据集的篡改手段包括了resize,压缩啊这些操作,其实和常规的文档类的数据集的ps还是有差别的,我们常说自然场景和文档篡改的差别挺大的,文档主要还是以ps这种操作为主。网络结构很普通,没什么好说的。原创 2022-09-01 17:53:29 · 1129 阅读 · 1 评论 -
f3net:fusion,feedback and focus for salient object detection
这是篇显著性检测的文章,但是我看到他有在篡改检测领域的应用,目前的篡改检测领域核心思路就是分类和分割两种路子,而在文档篡改检测领域,主要还是以分割为主,加上阿里天池有连续开源了两拨数据集,还是大有裨益的。这篇文章,结构非常花哨,但是我实际觉得这种设计上花哨的东西,其实意义不大,但是本文虽然是在做显著性检测,但是loss提出的还挺有意思的。论文笔记——F3Net: Fusion, Feedback and Focus for Salient Object Detection_随机ID的博客-CSDN博客。..原创 2022-09-01 15:53:49 · 1083 阅读 · 1 评论 -
busternet:Detecting copy-move image forgery with source/target localization
最后是一个融合模块,融合模块的损失是交叉熵,前两个分支都是bce,交叉上是因为此时算上背景是一个三分类,不是二分类了,融合分支的输出是softmax2d,然后在直接插值变成原图,在原图上用分类计算。这篇文章由于时间较久,我尽量比较精简的来记录一下。第一张图是核心图,首先看上面,第一是原图,第二张是gt,第三张是预测图,先看第二张gt,有三个部分,红色是篡改区域,绿色是相似图区域,蓝色是背景区域,标签制作如下,这三个区域其实对应了第一张图的三个监督的loss,.........原创 2022-09-01 11:57:28 · 891 阅读 · 0 评论 -
Thinking in Frequency: Face Forgery Detection by Mining Frequency-aware Clues
F3-Net 商汤Deepfake检测模型 - 知乎前言这篇论文是商汤团队在ECCV2020的一个工作: Thinking in Frequency: Face Forgery Detection by Mining Frequency-aware Clues,通过引入两种提取频域特征的方法FAD (Frequency-Aware Decomposition) 和LFS (L…https://zhuanlan.zhihu.com/p/260998460本文还是很值得读的,在篡改检测上应用...原创 2022-05-28 11:02:43 · 1562 阅读 · 3 评论 -
Image Manipulation Detection by Multi-View Multi-Scale Supervision
【速览】ICCV 2021丨MVSS-Net: 基于多视角多尺度监督的图像篡改检测《速览》栏目长期接收顶会顶刊文章精华稿件,欢迎投稿~https://mp.weixin.qq.com/s/Jkq2gQX-_Ss3kziIJU-oEg原创 2022-04-21 13:34:46 · 4846 阅读 · 3 评论 -
detecting text in natural image with connectionist text proposal network
场景文字检测—CTPN原理与实现 - 知乎对于复杂场景的文字识别,首先要定位文字的位置,即文字检测。这一直是一个研究热点。 Detecting Text in Natural Image with Connectionist Text Proposal NetworkCTPN是在ECCV 2016提出的一种文字检测算法。CTPN…https://zhuanlan.zhihu.com/p/34757009Ctpn检测的都是小框,宽度16像素(stride=16),在github上比较火的ocr项目chin原创 2022-03-22 15:50:55 · 4167 阅读 · 0 评论