机器学习之机器学习是什么?(基础版)简单易懂

本文介绍了机器学习的基本概念,包括模型如何基于数据训练和优化,数据集(训练集和测试集)的作用,标记信息在分类和回归中的应用,以及监督学习(分类和回归)与无监督学习(聚类)的区别。
摘要由CSDN通过智能技术生成

什么是机器学习

首先我先放一张笔记,有需要可以拿走
在这里插入图片描述
(字迹有些潦草)

何为机器学习?

在当今的大数据时代,有着很多的信息,其中有很多不乏是垃圾信息.对于某一些垃圾信息,人们一眼就可以看出,这时我们就可以想?是否能训练机器,让其自己识别出这些垃圾信息,来为我们提供便捷呢?那么人们就想到了可以通过大量的数据来训练模型,让模型在一定情况下能够自行判断一些问题.所以机器学习就是基于数据产生训练模型(在面对新情况时模型会自行判断),并通过不断的训练,会优化模型,从而使正确率提升.

接下来我会为大家详细讲解一下,模型数据集假设标记信息分类和回归聚类监督学习无监督学习来为大家初步介绍一下机器学习

模型

模型,就像一个懵懂无知的小孩,你问他问题(输入数据),他就会回答你(输出一个预测的值),但是这里要区分人工智能,因为它只能基于你给的数据来不断的提高预测结果的精度。并不具有自己的意识。

数据集

数据集,根据名字就知道,数据集就是承载数据的集合嘛。数据集一般分为两类,分别为训练集和测试集。"训练集"在训练阶段起重要意义,"测试集"在检验预测输出的阶段起重要作用

训练集以及假设

给一个模型输入训练集之后,模型会从数据中学习,那么从数据中学习的模型,我们称为"训练"或"学习"。在训练过程中,我们用到的数据叫做训练数据,其中每一个样本我们都可以理解它为基本的训练样本,而每一个训练样本合在一起就是一个训练集。模型经过不断的训练后,会形成某种未知的预测信息的能力,所以我们把它称为假设。而这种能力自身我们就将其称之为真相

测试集

通过不断的训练后,模型会变得成熟。那么我们通过什么来检测它是否能精准的预测呢?这时候就需要用到我们的测试集了。如果引用了大量测试集后,该模型也能很好地预测的结果,那么我们就可以认为该模型已经基本可以实现高精度预测了。

标记信息

这里取一个简单的例子((色泽=青绿,敲声=浊响,根蒂=蜷缩),好瓜)
这里关于样本信息比如说"好瓜",我们称之为标记,拥有标记的信息示例我们称之为样例Attention!!!
只有分类和回归问题的数据集要用标记,聚类使用的数据集一般不使用标记。别急,回归,分类和聚类马上会讲到。

分类和回归

如果预测的值是离散的,我们称之为分类,如果预测的值是连续的,我们称为回归。那么离散是什么意思呢?就比如说"好瓜"与"坏瓜"。那么连续又是啥?比如说水稻的成熟度为0.50, 0.85
这样理解起来应该就好理解一些了.

聚类

我们可以对某一对象进行聚类,相关算法将集中训练的对象分为若干组,每一个组称为一个"簇",这些自行分的""可能对应某种规则.比如"本地瓜",“外地瓜”.但是我们事先是不知道这些概念的,而且学习过程中训练集样本是不用标记信息的.

监督学习和无监督学习

根据训练是否拥有标记,我们可以将 信息学习任务分为两大类,
监督学习和无监督学习
监督学习,其代表是分类回归
无监督学习,其代表是聚类

监督学习

监督学习指的是我们给学习算法一个数据集,然后可以理解为这个数据集是由"正确答案"组成的

回归指的是我们可以通过训练模型来推测连续数据的属性
分类指的是我们可以推测出离散的输出值

无监督模型

无监督模型中要么没有标签,要么有着相同的标签.
针对数据集,无监督模型可以判断出两个不同的聚集簇
因此也被成为聚类算法

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值