文科生也能看的懂得人工智能原理

最新推荐文章于 2024-10-08 20:27:53 发布

IT学徒.

最新推荐文章于 2024-10-08 20:27:53 发布

阅读量1k

点赞数 11

分类专栏： AIGC 文章标签：人工智能

本文链接：https://blog.csdn.net/superheromen/article/details/137755707

版权

AIGC 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

文科生也能看的懂的人工智能原理

机器学习基本概念
- 什么是语言模型
- 人工智能级别
机器学习
深度学习

机器学习基本概念

什么是语言模型

在这里插入图片描述
语言模型（Language Model，简称 LM）是一个用于建模自然语言（即人们日常使用的语言）的概率模型。简单来说，语言模型的任务是评估一个给定的词序列（即一个句子）在真实世界中出现的概率。这种模型在自然语言处理（NLP）的诸多应用中，如机器翻译、语音识别、文本生成等，都起到了关键性的作用。
应用场景：

机器翻译：在生成目标语言句子时，语言模型用于评估哪个词序列更“自然”。
语音识别：同样的，语言模型可以用于从多个可能的转录中选择最可能的一个。
文本摘要：生成的摘要需要是语法正确和自然的，这也依赖于语言模型。

人工智能级别

弱人工智能：
限制领域人工智能（Narrow AI）或应用型人工智能(Applied AI),指的是专注于且智能解决特定领域问题的人工智能。例如：AlphaGo
强人工智能：
通用人工智能（Artificial General Intelligence）或完全人工智能（Full AI）,指的是可以胜任人类所有工作的人工智能
超人工智能:
假设计算机程序通过不断发展，可以比世界上最聪明，最有天赋的人类还聪明，那么，由此产生的人工智能系统就可以被称为超人工智能。

机器学习

简单来讲：机器学习就是使机器找出可以求解问题的函数。

学习原理

数据	苹果	橙子	香蕉
特征	“红色、圆型”	橙色、圆型	黄色浅弓型
建模	学习“苹果”	学习“橘子”	学习“香蕉”
模型	认识“苹果”	认识“橘子”	认识“香蕉”

在这里插入图片描述
再来举一个听的懂得的例子：

先说结论：机器学习=训狗。
你要能理解怎么训狗，就能非常轻易的理解机器学习的原理。比如你想教小狗学习动作“坐下”，一开始小狗根本不知道你在说什么。但是如果你每次都说坐下”然后帮助它坐下，并给它一块小零食作为奖励，经过多次重复，狗就会学会当听到“坐下”这个词时就要坐下。以此类推，小狗可以听懂各种指令，比如坐下，蹲下，握手等等。机器学习本质上跟教小狗一摸一样，只不过机器学习不是一条狗或者一只猫，而是用的“模型”。我们用电脑和特殊的程序（叫做“模型”）来代替小狗。我们给电脑一堆数据，比如一堆照片，其中有些是猫，有些是狗。我们用电脑和特殊的程序（叫做“模型”）来代替小狗。我们给电脑一堆数据，比如一堆照片，其中有些是猫，有些是狗。比如“模型”每区分正确一张照片，就给它奖励一分，否则扣一分，然后我们设定了目标是分数越高越好，那么“模型”就会根据这个机制进行不断的学习，最后就成为了一个非常优秀的区分猫狗的“好模型”。但与教小狗不同，电脑可以快速地查看成千上万张照片，并从中学习。电脑也可以学习很多其他复杂的任务，比如识别人的声音、推荐你可能喜欢的音乐，甚至帮助医生诊断疾病。从上面我们可以总结出来几个名词：

模型（Model）: 模型就像是电脑的“大脑”，用来处理和学习数据。你可以想象它为一个迷你的决策工厂，输入数据进去，输出结果。
数据集（Dataset）: 数据集就是用来训练模型的大量信息。这些信息可能是文字、图像、声音等。
标签（Label）: 标签是对数据集中每一项数据的解释或标记。比如，在一个由猫和狗照片组成的数据集中，每张照片会被标签为“猫”或“狗”。
训练（Train）和测试（Test）:训练是让模型从标签好的数据集中学习的过程。测试则是检查模型是否真的学会了某件事。
奖励（Reward）和惩罚（Punishment）: 在某些机器学习模式中，模型会根据其预测的准确性获得奖励或惩罚。
监督学习（Supervised Learning）和无监督学习（Unsupervised Learning）: 在监督学习中，模型从带有标签的数据中学习。在无监督学习中，数据没有标签，模型需要自己找出数据的结构。

从上面来看其实我们归纳一下，机器学习就是让电脑通过数据和例子来学习做某件事，而不是由人直接编程告诉它每一步应该怎么做。

任务分类：

大纲回归：输出结果为一个标量(Scalar),如输入今天的PM2.5、温度、臭氧浓度的数值，输出明天的PM2.5值
分类：输出结果为一个选项, 如输入一种水果，判断是否为苹果
结构化学习：输入输出结果的结构不一样，如输入一段语音，输出为文本。

张量：用于存储和运算各种形状的一个数组类型,只有数据大小没有方向的被称为零阶张量，有数据大小和方向的向量被称为一阶张量，矩阵被称为二阶张量。

训练方法分类：

监督学习：给算法一个数据集,并且给定正确答案。机器通过数据来学习正确答案的计算方法。
非监督学习（半监督学习，自监督学习、无监督学习）：给定的数据集没有“正确答案”,所有的数据都是一样的。无监督学习的任务是从给定的的数据集中挖掘出潜在的结构。
强化学习：让模型在环境中采取行动。获得结果反馈（奖励/惩罚）,从而在给定情况下采取最佳行动，来最大化奖励或最小化损失。

深度学习

深度学习兴起：

图形处理器作为硬件加速器之一，通过大量的图形处理单元与CPU协同工作，对深度学习、数据分析、以及大量的计算的工程应用进行加速。随着显卡的发展，GPU越来越强大，GPU开始主要为显示图像做优化，在计算上已经超越了通用的CPU。如此强大的芯片如果只是作为显卡就太浪费了，因此2007年NVIDIA推出第一个支持统一计算设备架构这一通用并行计算架构，该架构使GPU能够解决复杂的计算问题。