==计算机视觉面对的挑战
计算机视觉
定义:
解决计算机“看”的问题,处理对象是图像和视频
计算机视觉任务划分
初级视觉(对图像本身)
中级视觉(对图像的分割)
高级视觉(涉及到理解问题)
中级计算机视觉的任务
分类:
解决是什么的问题判断是什么类别的目标
检测:
是什么,在哪里定位目标的位置并且知道这个目标是什么
分割:
分为实例分割和语义分割(解决每个像素属于哪个目标或者场景)
|||如果图像里面是羊,以此来举例分析
\\实例分割:不同的羊要分割出来;
\\语义分割:语义分割只要把羊标为一类就行;
挑战
==自然语言处理面对的挑战
什么是自然语言处理呢?
自然语言处理=自然语言+处理
人类语言 理解和生成语言反馈
||拿中文自然语言为例,中文自然语言处理面临的挑战
==语音交互上面的挑战
什么是语音交互
识别,理解(结合语境分析),发出动作生成反馈
语音-->文本-->理解-->文本-->语音
应用:
实时字幕,会议记录