1. 人工智能(AI)
通俗来讲,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,人工智能是先“人工”后“智能”。人工智能行业有句话:有多少智能,背后就有多少人工。人工智能是新的工业革命,谁掌握了人工智能,谁就掌握了未来。
2. 人工智能五大核心技术
计算机视觉、机器学习、自然语言处理、机器人和语音识别。
3. 人工智能三个阶段
总体来说,人工智能分为计算智能、感知智能及认知智能三个阶段。计算智能就是数据运算和统计;感知智能就是视觉、触觉、声音等元素的探测和感知,对元素的识别与分类;认知智能就是对获取信息的理解、推理和决策,具备人类的基本思考认知能力。
4. 人工智能三大学派
符号主义(symbolicism),又称为逻辑主义、心理学派或计算机学派,其原理主要为物理符号系统(即符号操作系统)假设和有限合理性原理。
连接主义(connectionism),又称为仿生学派或生理学派,其主要原理为神经网络及神经网络间的连接机制与学习算法。
行为主义(actionism),又称为进化主义或控制论学派,其原理为控制论及感知-动作型控制系统。
5. 人工智能的三个核心要素
算法:借鉴人类的思考方式,算法是核心中的核心。是以哲学、数学、生物学、心理学、音乐学、神学、玄学等为基础的思维逻辑和系统顶层认知的智慧结晶。
数据:用于训练的数据,有标注好的数据和未标注的数据。
算力:计算机的处理能力。
没有合适的算法,理论上就不能解决问题;没有大量的数据,就无法训练模型;没有高性能的计算机(算力),训练速度就会非常缓慢。
6. 算力需要的XPU
CPU:Central Processing Unit, 中央处理器
GPU:Graphics Processing Unit, 图像处理器
TPU:Tensor Processing Unit, 张量处理器
DPU:Deep learning Processing Unit, 深度学习处理器
NPU:Neural network Processing Unit, 神经网络处理器
BPU:Brain Processing Unit, 大脑处理器
7. 数据标注
通过对数据贴标签、做记号、标颜色或划重点等方式,标注出其中目标数据的不同点、相似点或类别,以此达到让机器学习的功能。AI算法需要通过数据训练不断完善,而数据标注是大部分AI算法得以有效运行的关键环节。
8. 机器学习(ML)
机器学习是通过机器模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
9. 深度学习(DL)
利用深度神经网络来解决特征表达的一种学习过程,类似人类通过大脑层层思考问题,由一个知识综合多个知识/结果进行层层推理思考,最终得出正确/错误的决策或知识去执行。
10. 自然语言处理(NLP)
对人类语言的处理,生成结构化可定义的语言数据,比如句型、语法等。
11. 自然语言理解(NLU)
计算机能够理解和生成人类语言,和人一样能轻松沟通交流。
12. 语音识别(ASR)
将人类的语音中的词汇内容转换为计算机可读的输入。
13. 语音合成(TTS)
计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的语言输出的技术。
14. 计算机视觉(CV)
计算机从图像中识别出物体、场景和活动的能力,类似于人类日常生活中的视觉交互。
15. 神经网络(CNN)
神经网络是一种以人脑为模型的机器学习,简单地说就是创造一个人工神经网络,通过一种算法允许计算机通过不断合并新的数据来学习。
16. 人工智能、机器学习、深度学习三者之间的关系是什么?
机器学习是人工智能的一个实现途径,深度学习是机器学习的一种实现方法。
17. 监督学习
监督学习是机器学习中分类方法的一种,将样本数据和预期结果建立关联关系,通过对已知的结果和已知的样本数据进行的不断学习和训练,不断调整优化特征提取方法,提取样本数据的特征值和预期结果形成映射关系。对于新数据,借助样本数据的特征提取方法,提取新数据的特征值,对新的数据进行结果的预测。
18. 无监督学习
无监督学习就是不需要对样本数据进行结果标注,数据获取成本低,不需要人工标记数据,主要是分析和发现数据的内在结构,数据本身的自有特征,进行归纳和分类。无监督学习整体上分为聚类和降维两大类。
19. 半监督学习
半监督学习是监督学习和无监督学习相互结合的一种学习方法。通过有标签数据辅助训练无标签数据,无标签数据辅助训练出有标签数据,将有标签数据和无标签数据通过两种方法进行不同维度的学习来提升单一方法的效果。
20. 迁移学习
迁移学习是一种机器学习的方法,指的是一个预训练的模型被重新用在另一个任务中,起到举一反三的作用,将部分知识或模型应用到其它任务中,它并不是某一类特定的算法,而是一种处理问题的思想。
21. 联邦学习
联邦学习是一种分布式机器学习技术,通过在多个拥有本地数据的数据源之间进行分布式模型训练,在不需要交换本地个体或样本数据的前提下,仅通过交换模型参数或中间结果的方式,构建基于虚拟融合数据下的全局模型,从而实现数据数据隐私保护和数据共享计算的平衡。例如手机输入法在不同终端根据用户本地数据训练模型。
22. 强化学习
强化学习是一种机器学习的方法,是一种理解和自动化目标导向学习和决策的计算方法,它强调个体通过与环境的直接交互来学习,而不需要监督或完整的环境模型。类似于在学习过程中,自律性强的学生设定自己的目标和奖励,达成某个阶段目标和奖励,再不断自我提高目标和奖励标准,通过这种强化学习的方式不断提升学习效果。
23. 训练集
用来训练模型参数的那部分数据,类似于课堂或课后作业。
24. 验证集
用来在训练阶段验证模型训练效果,类似于课后小测验。
25. 测试集
用来验证模型效果的数据,类似于期中期末考试。