机器学习基础

本文介绍了有监督学习(包括离散和连续值预测)、无监督学习(聚类任务)和半监督学习的特点,详细讲述了机器学习流程中的训练、预测和数据划分,以及常用算法如逻辑回归、回归、聚类和损失函数优化方法。还讨论了过拟合、欠拟合问题,以及基础算法如线性回归和决策树。
摘要由CSDN通过智能技术生成

有监督学习:有确定的答案
分类任务:目标为离散值变量
回归任务:目标为连续值变量
无监督学习:没有确定的答案
聚类任务(进行归类):无目标,需要根据特征进行归类
半监督学习:一半有答案,一半没有答案

机器学习的流程:
训练:
从现有数据集进行学习数据的已有模式,生成模型
预测:
基于训练好的模型,预测未来的数据
#所以在拿到数据的时候,我们首先要进行划分训练集、验证集和测试集

常用的算法:
分类:
逻辑回归、支持向量机、神经网络、随机森林、Boosting方法、朴素贝叶斯
回归:
线性回归、决策树回归、随机森林回归
聚类:
Kmeans聚类

损失函数:算法总是朝着使得损失函数最小的方向来迭代优化
优化的方法,一般是梯度下降法,由此找到参数最优解
梯度下降法就是通过迭代的方法来找到损失函数最小的点,每一次迈一步,方向是函数的负梯度方向,一直到山底

交叉验证:
简单交叉验证
S折交叉验证
留一交叉验证

过拟合与欠拟合:
模型学习的太多,出现过拟合,导致学习的规律只适用于训练集
如果学的太少,那么就是欠拟合现象

算法基础:
线性回归:回归算法的基础
逻辑回归:线性分类算法基础
决策树:基础的树形结构,在分类问题上,根据特征进行 if-else判断,在各个节点上通过信息增益等指标来对节点进行分裂,最后形成树。
#可读性强,逻辑接近人脑
#类别特征无需额外处理
#速度较快

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值