机器学习概述(1)

本文概述了机器学习的基础概念,重点介绍了监督学习,包括K近邻算法、决策树、朴素贝叶斯、支持向量机和Logistic回归等算法。通过训练集建立输入与输出的关系,用于分类和回归问题。同时,提到了开发机器学习应用程序的基本步骤,从数据收集到算法测试。
摘要由CSDN通过智能技术生成

基础概念


机器学习主要分为监督学习、非监督学习、半监督学习和强化学习等四种学习方式

  1. 监督学习

通过已有的一部分输入数据与输出数据之间的对应关系(训练集),生成一个函数模型,将输入映射到合适的输出(测试集)。

 训练集:包括输入(特征)和输出(目标),是由人为标记的。
 测试集:评估模型的精确度。
 验证集:主要用来进一步确定模型的参数。

监督式学习的常见应用场景是分类问题回归问题。分类算法中目标变量的类型通常是离散的;而在回归算法中是连续的。

  1. 非监督学习

在非监督学习中,数据没有类别的信息,也不会给定目标值(没有训练集),而是直接对输入的数据进行建模。
非监督学习常见的应用场景是聚类关联规则的学习

  1. 半监督学习

简单来说就是介于监督学习和非监督学习中间的一种学习方式,采用有类别标注的数据和没有类比标注的数据相结合的学习方式。

主要考虑如何利用少量的样本标注和大量的未标注样本进行训练和分类  的问题,这样可以减少标注代价。

应用场景包括分类和回归,算法包括一些对常用监督式学习算法的延伸。

  1. 强化学习(主动学习)

输入数据作为对模型的反馈,而模型也必须针对反馈立刻做出调整。

监督学习中,输入数据仅作为检查模型对错的方式。

常见的应用场景包括动态系统以及机器人控制等。

开发机器学习应用程序的步骤


通常开发的步骤分为以下几步:

  1. 收集数据
  2. 准备输入数据(一般主要解决格式问题)
  3. 分析输入数据(判断数据中是否存在空值、异常值和垃圾数据)
  4. 训练算法(非监督学习不需要训练算法)
  5. 测试算法(必须用评测手段来检验算法的成功率)
  6. 使用
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值