内容
什么是图像识别,包括最基本的图像分类,很多其他的,检测分割也可以包括进来,更多的指的是图像检索模型
判断
OCR
分割
定义
根据应用,OCR更多的独立成一个单独的任务
解决哪些问题
分类问题
细粒度的困难分类问题
全食谱的分类
又增加了食谱,训练没法停止
图像识别关注的问题
图像检索架构,和NLP的语义索引架构,一样,原理都是相同的,目标检测,相当于,NLP里面提取一大段文本里面的核心词,文本摘要等等
流程
图像识别现状和问题
头部市场,人脸识别和文字识别
要不应用定制化,义务检测和动物识别
长尾应用,落地困难
技术难题
检索流程,每个单独都是一个应用
技术更新迭代快
理论和实践的差距
部署落地难
核心优势
首个开源的识别系统
应用
业界最全的网络骨架
丰富的度量学习
原创向量检索算法
高效推理部署
端到端打通,离线、云服务、边缘
优化策略,蒸馏
数据增广
计划