计算机视觉
文章平均质量分 96
挪木鸥玩数据
这个作者很懒,什么都没留下…
展开
-
阿里云OCR文档自学习(自定义KV模版)技术解析与代码复现
从一张图片中识别出所有的文本数据是最常见的OCR任务,现在市场上有很多开源的端到端模型可以实现,如百度开源的PaddleOcr等。但如果我们的任务是要提取出图片中关键的信息(不光识别出文字,还要知道文字的意义),这时通用的全文OCR就不能胜任了,往往需要对全文OCR的结果进行后处理。比如,现在我需要提取出一张身份证照片中的个人信息,最后得到{'姓名':'张三','性别':'男'}这样的kv键值对的格式,如果只进行文本OCR,当然可以一股脑的提到照片中的所有文本,但后续怎么知道文本“张三”是姓名呢?原创 2024-05-23 09:59:39 · 953 阅读 · 0 评论 -
【计算机视觉】基于YOLOv8的关键点检测的仪表盘读数方案详解
more整体流程:目录。原创 2024-03-20 17:44:58 · 2860 阅读 · 13 评论