计算机视觉与自然语言处理（Open AI）

人工智能MOS

已于 2024-01-26 19:52:36 修改

阅读量962

点赞数 10

文章标签：人工智能计算机视觉机器学习深度学习自然语言处理

于 2023-12-28 17:45:00 首次发布

本文链接：https://blog.csdn.net/2301_81887304/article/details/135262155

版权

语音识别是将语音转换为文本的技术，是自然语言处理的一个分支。通过特征的提取、模式的匹配将语音信号变为文本或命令，以实现机器识别和理解语音。按照应用场景的不同，可以大致分为三类；• 电信级系统应用：以自动语音服务的形式用在各行业的企业自动语音服务中心，具体的场景包括电话银行、股票交易、金融产品客服、电子商务、旅游服务等；• 嵌入式应用：以基础应用的形式集成在各类终端产品中，如机器人、手机、车载系统等；• 特殊应用：主要为安全部门提供声纹识别应用方案，用于自动身份辨认。

摘要由CSDN通过智能技术生成

1.语音识别技术

语音识别是将语音转换为文本的技术，是自然语言处理的一个分支。通过特征的提取、模式的匹配将语音信号变为文本或命令，以实现机器识别和理解语音。

按照应用场景的不同，可以大致分为三类；
• 电信级系统应用：以自动语音服务的形式用在各行业的企业自动语音服务中心，具体的场景包括电话银行、股票交易、金融产品客服、电子商务、旅游服务等；
• 嵌入式应用：以基础应用的形式集成在各类终端产品中，如机器人、手机、车载系统等；
• 特殊应用：主要为安全部门提供声纹识别应用方案，用于自动身份辨认。

主要瓶颈：
• 语音交互受背景噪音、语速等多重因素影响，不同场景识别率差别较大，实际应用仅限近距离使用；
• 语音交互成为下一个搜索引擎方式的主要阻碍是消费者习惯，多数消费者尚未形成语音使用习惯。

2.语义识别

语音识别解决的是计算机“听得见”的问题，而语义识别解决的是“听的懂”的问题，自然语言处理（NLP）表示语言能力，语言应用的模型通过建立计算机框架来实现语言模型，并根据语言模型来设计各种实用系统。

技术成熟度较低，主要瓶颈在于深度学习并非语义识别最佳解决方案。NLP现在实际的技术困难还是语义的复杂性，包含因果关系和逻辑推理的上下文等，现在解决这些问题的思路主要还是深度学习。深度学习拓展了神经网络的层次，而且大数据的积累和并行计算的增强则给这种方法奠定了基础，这也是最近机器学习非常火热的原因。因此基于大数据、并行计算的深度学习将会给NLP带来长足的进步，但是若想达到人类的这种理解层次，恐怕仅靠这种方法也很难实现。

3.计算机视觉

指用计算机来模拟人的视觉系统，实现人的视觉功能，以适应、理解外界环境和控制自身的运动。总的来讲，主要是视觉系统解决的是物体识别、物体形状和方位确认以及物体运动判断这三个问题，而计算机视觉的研究，则是专注于让机器代替人眼，解决这些问题

最低0.47元/天解锁文章

人工智能MOS

关注

10
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
计算机视觉与自然语言处理（Open AI）

语音识别是将语音转换为文本的技术，是自然语言处理的一个分支。通过特征的提取、模式的匹配将语音信号变为文本或命令，以实现机器识别和理解语音。按照应用场景的不同，可以大致分为三类；• 电信级系统应用：以自动语音服务的形式用在各行业的企业自动语音服务中心，具体的场景包括电话银行、股票交易、金融产品客服、电子商务、旅游服务等；• 嵌入式应用：以基础应用的形式集成在各类终端产品中，如机器人、手机、车载系统等；• 特殊应用：主要为安全部门提供声纹识别应用方案，用于自动身份辨认。
复制链接

扫一扫