研0如何选择人工智能领域的各个方向

文章介绍了AI的主要算法层面,包括机器学习、深度学习和强化学习,以及计算机视觉、自然语言处理、语音识别和知识图谱等子领域。同时,概述了工业界AI的应用,如搜索、推荐、计算广告和智能问答,强调了各领域的交叉与未来发展潜力。
摘要由CSDN通过智能技术生成

一.算法层面

AI离不开数据,同时也离不开算法,在算法层面大致有:机器学习ML(machine learning),深度学习DL(Deep learning),强化学习RL(Reinforcement learning)
在这里插入图片描述

二.子领域层面

AI个人理解的主要的方向有 计算机视觉、自然语言、语音、知识图谱这几大方向

搭建一个完整的AI,需要它的 视觉模块,听觉模块,语言模块,记忆推理认知模块,当然还有躯体模块等(机器手臂、传感器),所以AI也相应的分为了以下几个子领域,它们之间也有重叠和相互需要的部分

计算机视觉 CV:computer vision,可以简单的理解智能体的视觉模块,是研究机器如何看的科学,也是工业界AI应用场景最多的领域(不过好像加入的人有点多…),主要处理图像的识别、理解,目标跟踪、检测等问题

CV的子方向有:目标检测、目标识别、图像分类、图像分割、图像内容理解、姿态估计、SLAM(定位和地图构建)等等,比如自拍的美颜、p大进入校园刷的人脸识别、手机的指纹解锁、高端一点的自动驾驶(虽然还有很长一段路要走),安防,这些都涉及计算机视觉 CV

自然语言处理 NLP:Natural Language Processing,可以简单的理解智能体的语言模块,涉及语言的理解、认知的科学

主要的范畴和子方向有:中文自动分词、文本分类、文本情感分析、问答QA、对话Dialog、信息检索 Information retrieval、信息摘要 Information extraction、机器翻译等,比如用的apple的Sir、Google翻译、百度的搜索…这些都涉及NLP

相比于CV,NLP典型应用场景较少,范围窄而复杂度更高,不过cv和nlp也要相互联系的地方,个人觉得也是未来研究的热点方向,比如一个人走到一个地方环视一周,然后用语言描述出来,cv再根据描述重新构建场景,这个叫场景重建,再比如从艺术家的画中分析表达的情感态度,这也算二者结合的地方

语音 VC:Voice Recognition,可以简单的理解智能体的听觉模块,也算一个模式识别的问题,解决的是从多个声音(有许多噪声)中筛选出你想要的声音,比如微信聊天的语音识别,比如英语流利说的发音打分都要用到语音VC识别的相关算法

知识图谱 KG:Knowledge Graph,可以算作一个独立的方向,个人感觉和记忆理解这块比较接近,可以简单的理解智能体的记忆推理认知模块,也就是知识库的图数据呈现,是一种语义网络,我们这里把它单独划为一个子方向,把实体用关系串联起来,在知识库文本中挖掘语义,知识推理,使得AI更具有可解释性,也是非常重要的方向

总结一下,科学家想要搭建智能体,要分别搭建它的视觉、语言、听觉、记忆推理认知等模块,而这些模型也分别对应自己的领域和方向

四.工业界需求大方向
目前互联网大厂落地场景可以分为以下四类(问答还在快速发展,其他三个业务比较成熟稳定):

搜索、问答、推荐系统、计算广告
在这里插入图片描述
搜索:说大一点,众所周知的百度搜索引擎,Google搜索,说小一点,基本上每个成熟的网页、APP都需要自己的搜索功能

推荐:靠个性化推荐打出一片天地的字节跳动,根据用户偏好推荐相应的内容,阿里的淘宝推荐界面、美团根据用户口味喜好推荐外卖等等,知乎推荐你喜欢看的文章等等,应用场景也是相当广阔

计算广告:据说Facebook 90%以上的收入都是来自于广告,广告和推荐有交集,根据广告金主霸霸的需求,不断调整广告出现位置,提高广告点击率等等

智能问答:这里的问答是任务式问答,类似智能客服,不管是淘宝智能商家还是超市选购,还是医院挂号的问答机器,还是银行智能客服,问答这块的未来需求会很大!!所以提前划分到经典落地三大类:广告 搜索 还有推荐。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
人工智能领域涵盖了很多不同的方向,这些方向基于不同的算法和技术,可以用于解决不同的问题。下面将就人工智能领域的几个主要方向进行一些浅谈。 1. 机器学习:机器学习是人工智能领域的一个重要方向,它让计算机能够在没有明确的指示下学习和提高自己的性能。机器学习可以分为监督学习、无监督学习和强化学习等。监督学习是利用标记过的数据,让计算机学习如何进行分类、回归等任务。无监督学习是从无标记的数据中抽取特征并进行分类。强化学习是计算机利用反馈机制不断修正自己的决策策略。 2. 自然语言处理:自然语言处理是一种利用计算机对人类自然语言进行处理的技术。其主要的应用包括语音识别、自然语言理解和自然语言生成等。自然语言处理的发展,将使得计算机能够更好地理解人类的语言,进而实现人机交互和自然语义搜索等功能。 3. 计算机视觉计算机视觉是指通过计算机对视觉对象进行的识别和学习技术。其应用范围非常广泛,包括人脸识别、场景理解、视觉检测等。随着深度学习算法的发展,计算机视觉领域实现了很多重大突破。 4. 人机交互:人机交互是指人和计算机之间通过各种方式进行沟通交流的技术。该领域涵盖了诸多方向,包括语音识别、手势识别、触摸界面等。人机交互的发展将会让人们更加方便地使用计算机和智能设备,提高其工作和生活效率。 以上这些方向仅仅是人工智能领域的冰山一角,随着科技的进步和人们对于AI技术应用的探索,我们可以期待更多有趣的应用会不断涌现。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值