在处理纸质文档时,您需要找到并纠正错误或特意进行的更改。FineReader Engine 12 新版本中最需要的特性之一 是“比较文档”,功能可集成到企业软件中,用户可使用该功能自动检测两个文档版本之间的内容差异,从而快速跟踪变更、验证文档完整性或预防欺诈。请阅读这篇文章,探讨它为什么很棘手,它是如何工作的,以及您如何能使用它。
一般来说比较任何格式的两个文档时,都要尽量减少错误差异。另外,就是不能漏掉两个文档之间的任何实际差异。
造成错误差异主要有三个原因:
原因 |
解决方案 |
同样的文字在页面中的格式不 同或位置不同 |
获取文件结构信息 |
正文被页眉/页脚或在不同位置 插入的文字打断 |
|
OCR错误(如果必须使用 OCR获取文本) |