一、软件概述
1.1 运行环境
操作系统:Windows 7(64位) 或之后操作系统;
1.2 软件功能
- 电子档案归档
- 原始数据处理
- 过程数据处理
- 成果数据处理
- 工作量统计
1.3 启动软件
双击“承包经营权成果清理规范及整合建库.exe”文件,启动软件。
1.4 电子档案组织目录结构介绍
- 原始数据
- 扫描
- 分类
- 过程数据
- 更名
- 转换
- 成果数据
- 农业格式
- 自然资源格式
- 档案馆格式
原始数据: 存放档案初始成果(备份数据),用于查阅档案原始状态与后续处理。
扫描(临时目录):
获取电子档案的临时目录,文件名格式按“前缀(档案编号)+分隔符(_)+文件计数器”命名。如:TQ02201210001_0001.jpg
分类(重要目录):
获取“扫描”文件夹内的电子文件,按档案编号存储JPG格式。仅依据文件名(档案编号)分类、建立文件夹存储,并确保每个文件夹与纸质档案一一对应。
过程数据: 存放档案加工成果,按规则修改扫描件命名方式、通过人机交互等方式检查命名的正确性。
更名(重要目录):
“获取“分类”文件夹内的数据,按档案编号存储JPG格式。通过自动识别更新、人工更改等方式。修改文件名为设定的格式。如:登记簿_张三_360622102203020002J.JPG
转换(临时目录):
获取“更名”文件夹内的数据,按户存储JPG格式。按照设定逻辑条件转换为农业口数据格式,用于机器检查、人工检查。发现文件名命名错误等问题,参考“分类”文件夹内档案原始状态,修改“更名”文件夹内文件名称。
修正后,重复执行转换功能,进行人机交互等方式检查。
成果数据: 存放档案最终成果,检查无误的过程数据,按规则转换为相应的PDF格式文件。
农业格式(目录):
原始电子档案格式,按户存储。结构如下:
数字档案\县代码\乡镇代码\村级代码\发包方代码\承包方代码\材料名称_承包方姓名_承包合同编号.PDF
数字档案\县代码\乡镇代码\村级代码\发包方代码\承包方代码\材料名称_承包方姓名_承包地块编码.PDF
自然资源格式(目录):
电子档案格式,按不动产单元代码存储。结构如下:
数字档案\县代码\地籍区\地籍子区\不动产单元代码\材料名称_承包方姓名_承包合同编号.PDF
数字档案\县代码\地籍区\地籍子区\不动产单元代码\材料名称_承包方姓名_承包地块编码.PDF
档案馆格式(目录):
档案馆格式,按档号构成项分级建立文件夹存储,JPG格式与双层PDF。结构如下:
数字档案\X038\1967Y\026\ X038-1967Y-026-001\X038-1967Y-026-001.001.JPG
数字档案\X038\1967Y\026\ X038-1967Y-026-001.PDF
二、功能选择
2.1 电子档案归档
2.1.1 原始数据处理
扫描件文件名自动分类

输入目录:选择扫描文件夹。
输出目录:选择分类文件夹(按天扫描分类,子文件夹名称以档案编号命名)。
开始运行:读取输入目录下的JPG文件,整理分类后移动至输出目录。
2.1.2 过程数据处理
扫描件文件名自动识别

输入目录:选择分类文件夹。
输出目录:选择更名文件夹。
选择县区:选择数据成果对应的县区。
开始运行:读取输入目录下的JPG文件,通过OCR技术,本地离线模式识别文件内容。按照预设文件名称,识别文件名,并导出更名对照表。
扫描件文件名批量更新

选择文件:选择导出的更名对照表。
开始运行:读取更名对照表,自动复制文件(文件名自动识别与文件名批量更新,如果在不同机器操作,需检查修改Excel文件中文件路径)。
更名后档案数据转换为按户存储

输入目录:选择更名文件夹。
输出目录:选择转换文件夹。
选择县区:选择数据成果对应的县区。
开始运行:读取输入目录下的JPG文件,按照设定逻辑条件复制JPG文件到输出目录。
更名后档案数据自动化检查
检查结果:见运行记录。

输入目录:选择转换文件夹。
选择清单:选择清单Excel文件(A列CBFBM、B列CBFMC、C列DKBM)。
开始运行:读取输入目录下的JPG文件,通过OCR技术,本地离线模式识别文件内容。按照预设文件名称结合清单文件,识别、判断文件名是否正确。
2.1.3 成果数据处理
扫描件转PDF(农业格式)

输入目录:选择更名文件夹(档案卷号分类)。
输出目录:选择农业格式文件夹(承包方代码分类)。
开始运行:读取输入目录下的JPG文件,按照设定逻辑条件转换PDF文件到输出目录。
扫描件转PDF(自然资源格式)
更新中…
扫描件转JPG(档案馆格式)
更新中…
扫描件转PDF(档案馆格式)
更新中…
档案馆格式双层PDF制作(暂定)
使用软件Umi-OCR的批量文档功能,制作双层PDF。

修改以下代码,使输出文件名与输入文件名一致。
① 文件路径:Umi-OCR_Paddle_v2.1.3\UmiOCR-data\py_src\ocr\output\output_pdf_layered.py
② 文件路径:Umi-OCR_Paddle_v2.1.3\UmiOCR-data\py_src\tag_pages\BatchDOC.py
#文件路径:Umi-OCR_Paddle_v2.1.3\UmiOCR-data\py_src\ocr\output\output_pdf_layered.py
#self.outputPath = f"{self.dir}/{self.fileName}.layered.pdf" # 输出路径
self.outputPath = f"{self.dir}/{self.fileName}.pdf" # 输出路径

#文件路径:Umi-OCR_Paddle_v2.1.3\UmiOCR-data\py_src\tag_pages\BatchDOC.py
#fileNameStr = os.path.splitext(os.path.basename(path))[0]
#outputFileName = nameTemplate.replace(r"%name", fileNameStr) # 替换名称元素
outputFileName = os.path.splitext(os.path.basename(path))[0]

2.1.4 工作量统计
工作量统计(按户)

输入目录:选择更名文件夹(档案卷号分类)。
选择日期:选择统计日期。
开始运行:档案多户一卷,按所选日期统计更名文件夹内电子档案的户数。
三、软件运行记录
3.1 log
软件目录内“Log”文件夹保存软件运行日志。
3.2 err
软件目录内“Err”文件夹保存软件错误日志。
1773

被折叠的 条评论
为什么被折叠?



