BaiduOCR实现身份证,银行卡,机动车牌,图像审核等识别

提起AI,想必大家感觉就是神秘莫测,结合现实。今天看了一下BaiduOCR的技术支持,大概实现了身份证,银行卡,机动车牌,图片审核,这几个案例的识别。不得不说百度对图像的处理还是很强大的。根据开源出来的接口实现对以上功能的开发还是不错的。
废话不多说,既然那么神秘,我们也可以试着自己做一个识别Demo,案例会在最下方提供
1.点击链接BaiduAI

进入控制台登陆自己的百度云账号

2.登陆成功会进入自己的控制台,默认开通的服务如下

我们以文字识别为例,点击文字识别,

可以看到可用服务列表,并不是绝对免费的。但是程序员拿来装X应该没问题

3.创建应用

图中信息很明确,根据自己需要勾选相应的功能,当然部分功能是收费的,具体收费标准点这里

因为程序语言为Object-C 运用于ios上,所以这里我直接勾选如上图,(这里需要注意一点,包名绑定这里,必须要绑定自己创建的工程Bundle Identifier。要不等你一切做好之后发现会提示不匹配工程)确认无误后点击立即创建

创建成功,点击应用详情,进入自己创建的应用查看详情

拿到了自己的APPID,APIKey,SecretKey,记得保存一份,等下项目中要想实现以上功能必须通过这几个东西生成BaiduOCR的Token用,才可以。下边的API列表很详细的告诉我们当前这个项目接入的Api同时收费情况一目了然。很清晰。

4.接入服务

到了这一步,相信你已经成为一名合格的百度OCR的开发者了。下边开始把OCR服务接入我们工程
1.获取百度OCR Access Token
根据官方文档获取Access Token并保存到本地(注意token有效期为30天,过期需要重新获取接口保存token)

static NSString * const BaiduAppID           = @"9991413";
static NSString * const BaiduApiKey          = @"E2jIt1TZqt1EVYGVdH3L1Tb3";
static NSString * const BaiduSecretKey       = @"kIf9V9BktenQCFG8EpmlWChvlTz6GKbl";
static NSString * const BaiduAccess_tokenUrl = @"https://aip.baidubce.com/oauth/2.0/token";
#pragma mark - 获取百度AIAccess Token。有效期为30天
- (void)getBaiduAIAccessToken{
    /*
     请求URL数据格式

     向授权服务地址https://aip.baidubce.com/oauth/2.0/token发送请求(推荐使用POST),并在URL中带上以下参数:

     grant_type: 必须参数,固定为client_credentials;
     client_id: 必须参数,应用的API Key;
     client_secret: 必须参数,应用的Secret Key;

     https://aip.baidubce.com/oauth/2.0/token?
     grant_type=client_credentials&
     client_id=Va5yQRHlA4Fq4eR3LT0vuXV4&
     client_secret= 0rDSjzQ20XUj5itV7WRtznPQSzr5pVw2&


     */
    //    [[AipOcrService shardService] authWithAK:@"sLdWP9rGQ7iu63Pi4hvUP3qw" andSK:@"WF2fWKb8lQ2bfGB5MAAsixIGXCUzWipX"];



    NSMutableDictionary * dictionary = [[NSMutableDictionary alloc]init];
    [dictionary setObject:@"client_credentials" forKey:@"grant_type"];
    [dictionary setObject:BaiduApiKey forKey:@"client_id"];
    [dictionary setObject:BaiduSecretKey forKey:@"client_secret"];


    [NetWorkTool postNetWorkWithURL:BaiduAccess_tokenUrl paramaters:dictionary success:^(id object) {
        NSLog(@"%@",object);
        NSString * access_token = [object objectForKey:@"access_token"];
        NSString * expiresHaveTime = [NSString stringWithFormat:@"%@",[object objectForKey:@"expires_in"]];
        [[NSUserDefaults standardUserDefaults] setObject:access_token forKey:AccessTokenKey];
        [[NSUserDefaults standardUserDefaults] setObject:expiresHaveTime forKey:TokenValidity];
        [[NSUserDefaults standardUserDefaults] synchronize];
        NSInteger validityTime = [expiresHaveTime integerValue];
        if (validityTime <=0 || !validityTime) {
            UIAlertController * alertC = [UIAlertController alertControllerWithTitle:@"Warring" message:@"您使用的百度AI识别功能Access_Token已失效,请重新获取" preferredStyle:UIAlertControllerStyleActionSheet];
            UIAlertAction * confirmAction = [UIAlertAction actionWithTitle:@"确定" style:UIAlertActionStyleDefault handler:^(UIAlertAction * _Nonnull action) {
                [self.window.rootViewController dismissViewControllerAnimated:YES completion:^{


                }];

            }];

            [alertC addAction:confirmAction];
            [self.window.rootViewController presentViewController:alertC animated:YES completion:nil];


        }

    } failure:^(id failure) {

        NSLog(@"%@",failure);
    }];
}
这里请求数据用到了自己对AFNetworking的简单封装,有兴趣可以到文章最后Demo地址进行查看

获取Access Token 成功的话,我们可以根据AI开放平台中的文字识别API技术文档来搞事情了。

以身份证识别为例

从官方给出的API文档可以看出,通过POST方法向BaiduAI服务器发起请求,重点是链接中必须携带刚才获取的Access Token,由此可以看出我们在百度AI平台创建应用的重要性了。。。

头部需携带一下参数
Content-Type    application/x-www-form-urlencoded
重要的是Body中带的参数,

可以看出 image是必须携带的,并且要求还很多

图像数据,base64编码,要求base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式

要求一大串,不过没办法。想要获取到数据,还是要老老实实跟着文档走。这个提出一个坑。卡了三天没找到原因(其实我也没那么笨啊)

base64编码,对于这个东西,真没细心理解过。百度给出以下定义
    /*
     NSDataBase64Encoding64CharacterLineLength其作用是将生成的Base64字符串按照64个字符长度进行等分换行
     NSDataBase64Encoding76CharacterLineLength其作用是将生成的Base64字符串按照76个字符长度进行等分换行
     NSDataBase64EncodingEndLineWithCarriageReturn其作用是将生成的Base64字符串以回车结束
     NSDataBase64EncodingEndLineWithLineFeed其作用是将生成的Base64字符串以换行结束。
     */
亲测只有使用了NSDataBase64EncodingEndLineWithCarriageReturn这个枚举的时候,图片识别才不会报图片格式错误。具体原因不详。有知道的麻烦不辞辛苦告知下
请求代码示例
身份证识别
curl -i -k 'https://aip.baidubce.com/rest/2.0/ocr/v1/idcard?access_token=24.f2c915b857ee62189abb7f92df0e8453.2592000.1499493935.282335-9395294' --data 'id_card_side=front&image=【图片Base64编码,需UrlEncode】' -H 'Content-Type:application/x-www-form-urlencoded'

到这里,其实基本功能已经实现。我们正常的通过拍照,或者相册中获取过来的图片,就可以识别出来了。

如果还想看更多的比如银行卡,车牌号,图文识别等的实现,请移步到我的GitHub地址
本文为个人原创,未经本人允许,禁止转载。
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值