《机器学习实战》学习笔记:机器学习基础

本文介绍了机器学习的基础概念,包括如何利用训练集让算法发现特征与目标变量的关系。机器学习主要任务分为监督学习(分类和回归)和无监督学习(聚类和密度估计)。Python因其简洁的语法和丰富的库成为开发机器学习应用的首选语言。开发流程包括数据收集、预处理、分析、训练、测试和部署。
摘要由CSDN通过智能技术生成

机器学习的基础

机器学习的简单概述

简单而言,机器学习就是将无序的数据转换成有用的信息。
训练集是用于训练机器学习算法的数据集合,必须确定知道目标变量的值,以便机器学习算法可以发现特征和目标变量(机器学习算法的预测结果)之间的关系。

机器学习的主要任务

机器学习分类

  • 监督学习

    • 分类
    • 回归
  • 无监督学习

    • 聚类
    • 密度估计

监督学习–知道“特定”的预测结果,即目标变量的分类消息。
分类:将实例数据划分到合适的分类,目标变量的类型通常为标称型(离散)。
回归:通过特定数据点拟合曲线,用于预测数值型数据(连续)。
无监督学习:数据没有类别信息,也没有给定目标值。(数据无标签)(可降低数据特征的维度)
聚类:将数据集合分成由类似的对象组成的多个类的过程。
密度估计:寻找数据统计值的过程。

开发机器学习应用程序的步骤:
收集数据->准备输入数据->分析输入数据->训练算法->测试算法->使用算法

Python语言的优势

  • Python的语法清晰(可执行伪代码)
  • 易于操作纯文本文件
  • 使用广泛,存在大量的开发文档
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值