通用机打发票识别
支持对国家/地方税务局发行的横/竖版通用机打发票的23个关键字段进行结构化识别,包括发票类型、发票号码、发票代码、开票日期、合计金额大写、合计金额小写、商品名称、商品单位、商品单价、商品数量、商品金额、机打代码、机打号码、校验码、销售方名称、销售方纳税人识别号、购买方名称、购买方纳税人识别号、合计税额等。
请求示例
HTTP 方法:POST
请求URL:http://39.106.33.248:8088/invoice
Header如下:
参数 | 值 |
---|---|
Content-Type | application/x-www-form-urlencoded |
请求参数
form-data参数
参数 | 是否必选 | 类型 | 可选值范围 | 说明 |
---|---|---|---|---|
multipartFile | 是 | file | 上传文件 |
Query参数
参数 | 是否必选 | 类型 | 可选值范围 | 说明 |
---|---|---|---|---|
type | 是 | string | image/pdf_file | -image:识别图片 -pdf_file:识别PDF |
num | 否 | string | - | 需要识别的PDF文件的对应页码,当 pdf_file 参数有效时,识别传入页码的对应页面内容,若不传入,则默认识别第 1 页 |
返回示例
{
"words_result_num": 23,
"direction": 0,
"words_result": {
"AmountInWords": "贰仟元整",
"AmountInFiguers": "2000.00",
"Time": "",
"City": "",
"CommodityPrice": [
{
"row": "1",
"word": "527"
}
],
"CommodityAmount": [],
"PurchaserName": "张益智",
"Province": "山西",
"InvoiceType": "山西省国家税务局通用机打发票",
"SheetNum": "第一联",
"CommodityNum": [
{
"row": "1",
"word": "1"
}
],
"SellerRegisterNum": "",
"TotalTax": "",
"CheckCode": "",
"InvoiceCode": "114001811401",
"CommodityUnit": [],
"InvoiceDate": "2018年06月25日",
"PurchaserRegisterNum": "",
"CommodityName": [
{
"row": "1",
"word": "1200639512"
}
],
"SellerName": "",
"InvoiceNum": "00013354",
"MachineNum": "",
"IndustrySort": "力"
},
"log_id": 1759064230275090043
}
返回参数
字段 | 是否必选 | 类型 | 说明 |
---|---|---|---|
log_id | 是 | uint64 | 唯一的log id,用于问题定位 |
direction | 是 | int32 | 图像方向。 - - 1:未定义, - 0:正向, - 1:逆时针90度, - 2:逆时针180度, - 3:逆时针270度 |
words_result_num | 是 | uint32 | 识别结果数,表示words_result的元素个数 |
words_result | 是 | object{} | 识别结果 |
+ InvoiceType | 否 | string | 发票类型 |
+ InvoiceCode | 否 | string | 发票代码 |
+ InvoiceNum | 否 | string | 发票号码 |
+ InvoiceDate | 否 | string | 开票日期 |
+ AmountInFiguers | 否 | string | 合计金额小写 |
+ AmountInWords | 否 | string | 合计金额大写 |
+ CommodityName | 否 | array[] | 商品名称 |
++ row | 否 | unit32 | 行号 |
++ word | 否 | string | 内容 |
+ CommodityUnit | 否 | array[] | 商品单位 |
++ row | 否 | unit32 | 行号 |
++ word | 否 | string | 内容 |
+ CommodityPrice | 否 | array[] | 商品单价 |
++ row | 否 | unit32 | 行号 |
++ word | 否 | string | 内容 |
+ CommodityNum | 否 | array[] | 商品数量 |
++ row | 否 | unit32 | 行号 |
++ word | 否 | string | 内容 |
+ CommodityAmount | 否 | array[] | 商品金额 |
++ row | 否 | unit32 | 行号 |
++ word | 否 | string | 内容 |
+ IndustrySort | 否 | string | 行业分类 |
+ MachineNum | 否 | string | 机打号码 |
+ CheckCode | 否 | string | 校验码 |
+ SellerName | 否 | string | 销售方名称 |
+ SellerRegisterNum | 否 | string | 销售方纳税人识别号 |
+ PurchaserName | 否 | string | 购买方名称 |
+ PurchaserRegisterNum | 否 | string | 购买方纳税人识别号 |
+ TotalTax | 否 | string | 合计税额 |
+ Province | 否 | string | 省 |
+ City | 否 | string | 市 |
+ Time | 否 | string | 时间 |
+ SheetNum | 否 | string | 联次 |
pdf_file_size | 否 | string | 传入PDF文件的总页数,当type参数有效时返回该字段 |