asp识别增值税发票,利用百度ocr识别,专票,全电发票,普票等用asp编写

昨天接到一个写asp的朋友信息,他领导让他写一个识别增值税发票的代码,把电子发票pdf文件上传后,能把所有信息识别完导入数据库。看似简单的需求可把我这位朋友难为到了,昨晚非拉着我去吃喝洗,一条龙伺候,我都给他说了,这是小事,有吃饭的时间就写完了,他非不听,非要排面,整的我一晚上晕头转向的,今天研究了半天,说难不难,说不难吧又好多坑,先说遇到的坑,由于是接入了百度的ocr,他的开发文档做的全靠猜,绕来绕去的,搞两小时。然后上传pdf文件,又遇到坑了,需要先转成二进制后,在去识别,直接识别不行,这个坑又玩了1个多小时,用了半天才搞定,有这个需求的可以直接拷代码,对于asp用户来说,搞这些确实有些难了,但是asp用户量还很大,估计用的人比较多,不说了,上代码:

下面就是asp写的ocr识别增值税发票的代码,不光是增值税发票,专票、全电发票(新版全国统一电子发票,专票/普票)、卷票、区块链发票等全可以识别:

Set objStream = Server.CreateObject("ADODB.Stream")'创建了一个ADODB.Stream对象,并将其赋值给objStream变量。

    ' 设置Stream对象属性
    objStream.Type = 1 ' adTypeBinary,将objStream对象的Type属性设置为1,表示二进制数据。
    objStream.Open'打开objStream对象。
    objStream.LoadFromFile Server.MapPath(filePath)'从指定的文件加载数据到objStream对象中。Server.MapPath(filePath)用于将相对路径转换为服务器上的绝对路径。

    ' 读取二进制数据
    Dim binaryData
    binaryData = objStream.Read'读取objStream对象中的二进制数据,并将其存储在binaryData变量中

    ' 关闭Stream对象
    objStream.Close
    Set objStream = Nothing

    ' 将二进制数据转换为Base64格式
    Dim base64, dm, elen, i
    Set dm = Server.CreateObject("MSXML2.DomDocument")
    Set elen = dm.CreateElement("tmp")'创建了一个MSXML2.DomDocument对象,并利用其将二进制数据转换为Base64格式的字符串。
    elen.dataType = "bin.base64"
    elen.nodeTypedValue = binaryData
    base64 = elen.text
    Set elen = Nothing
    Set dm = Nothing

    ' 返回Base64编码结果
    FileToBase64 = base64'将Base64编码的结果赋值给FileToBase64函数,并作为函数的返回值。

set obj = getjson(res)
        if isobject(obj) Then
            response.Write(obj.words_result.PurchaserName)&"<br>"
            response.Write(obj.words_result.AmountInFiguers)&"<br>"
            response.Write(obj.words_result.AmountInWords)&"<br>"
            response.Write(obj.words_result.SellerBank)&"<br>"
            response.Write(obj.words_result.InvoiceCode)&"<br>"
            response.Write(obj.words_result.SellerName)&"<br>"
        End If
    set obj = Nothing

asp编写的代码可实现对增值税普票、专票、全电发票(新版全国统一电子发票,专票/普票)、卷票、区块链发票等的识别,包括发票基本信息、销售方及购买方信息、商品信息、价税信息等,其中五要素字段的识别准确率超过 99.9%; 同时,支持对增值税卷票的 21 个关键字段进行识别,包括发票类型、发票代码、发票号码、机打号码、机器编号、收款人、销售方名称、销售方纳税人识别号、开票日期、购买方名称、购买方纳税人识别号、项目、单价、数量、金额、税额、合计金额(小写)、合计金额(大写)、校验码、省、市,四要素字段的识别准确率可达95%。

  • 9
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
坛子里有破解版的Asprise-OCR-Java,其原理就是利用开启CloseWin.exe窗口扫描有没有Asprise弹出过期的窗口,更具信息框的标题栏来判断是否要关闭此信息窗口。2011年7月以后的使用版无论是点击确定还是关闭按钮,都要跳转到Asprise网站。 此次真正破解的是AspriseOCR.dll这个文件。根据跟踪运行主要汇编代码如下: 10006CF4 . 50 push eax ; /pSystemTime 10006CF5 . FF15 C0931110 call dword ptr ds:[; \GetSystemTime 10006D19 . 68 02000080 push 0x80000002 ; |hKey = HKEY_LOCAL_MACHINE 10006D1E . FF15 10901110 call dword ptr ds:[; \RegCreateKeyExA 110006D39 . 68 9CA61110 push AspriseO.1011A69C ; |Title = "All rights reserved. Lab Asprise! (c) 1998-2008" 10006D3E . 68 D0A71110 push AspriseO.1011A7D0 ; |Text = "You are using the trial version of Asprise OCR. Do you want to remove this message box by buying a very affordable license from Lab Asprise? " 10006D53 . 68 98A71110 push AspriseO.1011A798 ; |FileName = "http://asprise.com/product/ocr/index.php?Ref=Eval" 由此可见,分析结果如下: 1.引用顺序 DevIL.dll ILU.dll AspriseOCR.dll AspriseJTwain.dll (DevIL.dll 是算法库) 2.使用 GetSystemTime获得系统的当前时间,和注册表里的键值(二进制格式,估计是第一次使用时间)处理运算,如果时间过期就会弹出信息框提醒需要购买license. 3.注册表中HKEY_LOCAL_MACHINE\SOFTWARE\Asprise OCR\ 有键值,试用版有键值现已将AspriseOCR.dll 破解,经过测试,将电脑时间调整到任何时间,都不会弹出信息框。 HKEY_LOCAL_MACHINE\SOFTWARE\Asprise OCR\ 如果以前运行过此类OCR,请将此注册表的键值先 删除。四个动态库可放到C:\WINDOWS\system32 下,也可以放到jre\bin下,或者是PATH 指定环境变量. 仅供个人学习使用。一份网站Asprise-OCR-Java原始Demo,一个破解文件 四个动态库。具体java Demo,参看原始Demo实例。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值