从一次数据导入说起

本文作者分享了在处理Excel和Word数据导入系统过程中遇到的问题及解决方案。学习了Excel宏编程以提高处理效率,并了解到RPA(Robotic Process Automation)在自动化数据处理中的应用。进一步,作者探讨了OCR(Optical Character Recognition)技术,尤其是结合深度学习进行文字识别,以应对纸质媒介信息的数字化挑战。
摘要由CSDN通过智能技术生成

之前领导给了个任务,将一批存放在Excel和word中的数据导入到现有的系统中。

这些Excel和word数据没有统一的规则,也存在数据不完整的问题。在完成任务的过程中,难免恼火。

但是这次任务引发了我的一系列思考,记录如下:

一、关于Excel宏编程

此次任务是从Excel和Word中导入,我精通java编程,也对navicat工具的使用比较熟悉,如果在此基础上,对Excel宏编程也了如指掌就更好了。

后来我就学习了Excel宏编程相关知识,受益匪浅,今后一定还会有用得到的时候。

学习链接:【王佩丰】Excel VBA视频教程 完整版【共20课时】_Excel课程-51CTO学堂

二、关于RPA

后来我进而联想到,除了从Excel和Word导入之外,还可能涉及到别的电子文档,甚至从别的软件、别的系统导入,不一定非得通过第一种JAVA编程的方式。

后来从朋友那里了解到一个叫“RPA”的东西。

RPA是什么?RPA发展极简史_UB Store的技术博客_51CTO博客

三、关于OCR

那么以上这些,都还停留在从电子信息到信息系统的层面。

人们的最终目的,实际上是【将各种去到得来的信息存储进信息系统】。那么纸媒介肯定也应该是考虑的对象。

然后我就学习了OCR相关知识。在这个过程中,尤其学习了卷积神经网络相关知识。除了下面参考到的资料,关键来源还有这个:

 

【OCR技术系列之一】字符识别技术总览_51CTO博客_ocr识别技术

【OCR技术系列之二】文字定位与切割_51CTO博客_ocr文字定位

【OCR技术系列之三】大批量生成文字训练集_51CTO博客_ocr文字识别训练

【OCR技术系列之四】基于深度学习的文字识别(3755个汉字)_51CTO博客_OCR文字识别技术

深度学习教程 | 卷积神经网络解读

【毕业设计】基于深度学习卷积神经网络的手写字符识别_Mr_DC_IT的博客-CSDN博客

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值