文科生也能看的懂得人工智能原理

机器学习基本概念

什么是语言模型

在这里插入图片描述
语言模型(Language Model,简称 LM)是一个用于建模自然语言(即人们日常使用的语言)的概率模型。简单来说,语言模型的任务是评估一个给定的词序列(即一个句子)在真实世界中出现的概率。这种模型在自然语言处理(NLP)的诸多应用中,如机器翻译、语音识别、文本生成等,都起到了关键性的作用。
应用场景:

  • 机器翻译:在生成目标语言句子时,语言模型用于评估哪个词序列更“自然”。
  • 语音识别:同样的,语言模型可以用于从多个可能的转录中选择最可能的一个。
  • 文本摘要:生成的摘要需要是语法正确和自然的,这也依赖于语言模型。

人工智能级别

  • 弱人工智能:
    限制领域人工智能(Narrow AI)或应用型人工智能(Applied AI),指的是专注于且智能解决特定领域问题的人工智能。例如:AlphaGo
  • 强人工智能:
    通用人工智能(Artificial General Intelligence)或完全人工智能(Full AI),指的是可以胜任人类所有工作的人工智能
  • 超人工智能:
    假设计算机程序通过不断发展,可以比世界上最聪明,最有天赋的人类还聪明,那么,由此产生的人工智能系统就可以被称为超人工智能。
    在这里插入图片描述

机器学习

简单来讲:机器学习就是使机器找出可以求解问题的函数。

学习原理

数据苹果橙子香蕉
特征“红色、圆型”橙色、圆型黄色浅弓型
建模学习“苹果”学习“橘子”学习“香蕉”
模型认识“苹果”认识“橘子”认识“香蕉”

在这里插入图片描述
再来举一个听的懂得的例子:

先说结论:机器学习=训狗。
你要能理解怎么训狗,就能非常轻易的理解机器学习的原理。比如你想教小狗学习动作“坐下”,一开始小狗根本不知道你在说什么。但是如果你每次都说坐下”然后帮助它坐下,并给它一块小零食作为奖励,经过多次重复,狗就会学会当听到“坐下”这个词时就要坐下。以此类推,小狗可以听懂各种指令,比如坐下,蹲下,握手等等。机器学习本质上跟教小狗一摸一样,只不过机器学习不是一条狗或者一只猫,而是用的“模型”。我们用电脑和特殊的程序(叫做“模型”)来代替小狗。我们给电脑一堆数据,比如一堆照片,其中有些是猫,有些是狗。我们用电脑和特殊的程序(叫做“模型”)来代替小狗。我们给电脑一堆数据,比如一堆照片,其中有些是猫,有些是狗。比如“模型”每区分正确一张照片,就给它奖励一分,否则扣一分,然后我们设定了目标是分数越高越好,那么“模型”就会根据这个机制进行不断的学习,最后就成为了一个非常优秀的区分猫狗的“好模型”。但与教小狗不同,电脑可以快速地查看成千上万张照片,并从中学习。电脑也可以学习很多其他复杂的任务,比如识别人的声音、推荐你可能喜欢的音乐,甚至帮助医生诊断疾病。从上面我们可以总结出来几个名词:

  • 模型(Model): 模型就像是电脑的“大脑”,用来处理和学习数据。你可以想象它为一个迷你的决策工厂,输入数据进去,输出结果。
  • 数据集(Dataset): 数据集就是用来训练模型的大量信息。这些信息可能是文字、图像、声音等。
  • 标签(Label): 标签是对数据集中每一项数据的解释或标记。比如,在一个由猫和狗照片组成的数据集中,每张照片会被标签为“猫”或“狗”。
  • 训练(Train)和测试(Test):训练是让模型从标签好的数据集中学习的过程。测试则是检查模型是否真的学会了某件事。
  • 奖励(Reward)和惩罚(Punishment): 在某些机器学习模式中,模型会根据其预测的准确性获得奖励或惩罚。
  • 监督学习(Supervised Learning)和无监督学习(Unsupervised Learning): 在监督学习中,模型从带有标签的数据中学习。在无监督学习中,数据没有标签,模型需要自己找出数据的结构。

从上面来看其实我们归纳一下,机器学习就是让电脑通过数据和例子来学习做某件事,而不是由人直接编程告诉它每一步应该怎么做。

任务分类:

  • 大纲回归:输出结果为一个标量(Scalar),如输入今天的PM2.5、温度、臭氧浓度的数值,输出明天的PM2.5值
  • 分类:输出结果为一个选项, 如输入一种水果,判断是否为苹果
  • 结构化学习:输入输出结果的结构不一样,如输入一段语音,输出为文本。

张量:用于存储和运算各种形状的一个数组类型,只有数据大小没有方向的被称为零阶张量,有数据大小和方向的向量被称为一阶张量,矩阵被称为二阶张量。

训练方法分类:

  • 监督学习:给算法一个数据集,并且给定正确答案。机器通过数据来学习正确答案的计算方法。
  • 非监督学习(半监督学习,自监督学习、无监督学习):给定的数据集没有“正确答案”,所有的数据都是一样的。无监督学习的任务是从给定的的数据集中挖掘出潜在的结构。
  • 强化学习:让模型在环境中采取行动。获得结果反馈(奖励/惩罚),从而在给定情况下采取最佳行动,来最大化奖励或最小化损失。

深度学习

深度学习兴起:

图形处理器作为硬件加速器之一,通过大量的图形处理单元与CPU协同工作,对深度学习、数据分析、以及大量的计算的工程应用进行加速。随着显卡的发展,GPU越来越强大,GPU开始主要为显示图像做优化,在计算上已经超越了通用的CPU。如此强大的芯片如果只是作为显卡就太浪费了,因此2007年NVIDIA推出第一个支持统一计算设备架构这一通用并行计算架构,该架构使GPU能够解决复杂的计算问题。

深度学习本质上是一个三层或者更多层的神经网络。

在这里插入图片描述

前向传播

输入层提取数据进行处理,输出层完成回归/分类。输入层和输出层又可称为可视

反向传播

使用梯度下降等优化算法计算回归/分类的误差,调整各层反向传播函数的权重和偏置。支持从大量数据中进行学习

深度学习框架

  • Tensorflow:

由Google开发的开源深度学习框架,具有高度的灵活性和可拓展性。

  • PyTorch:

由Facebook开发的开源深度学习框架,以动态计算图和易用性著称。

  • PaddlePaddle:

以百度多年的深度学习技术研究的和业务应用为基础,是中国首个自主研发、功能完备、开源开放的产业级深度学习平台。

深度学习的工作原理

  • 神经元:每个神经元接受信息作为输入,经过处理后,输出的结果会作为下一个神经元的输入。

  • 权重:在信息传入神经元后,初始化每个信息的权重,训练中根据反馈更新信息的权重。

  • 偏置:神经元信息乘以权重后需要加上偏置项,。使得结果再范围中。

  • 激活函数;在每一层神经网络输出后使用的函数,目的是将输入信息转化成输出信息。

  • 周期:一个Epoch指一次前向传播和反向传播的过程。

  • 批次:在训练神经网络的时候,补一次发送整个输入,而是将输入分成几个随机大小相等的块分批次传入神经网络。

  • 丢弃:在训练过程中丢弃隐藏层的部分神经元,防止神经网络过拟合。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

IT学徒.

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值