机器学习---基础

 

一.机器学习工作流程
    1.定义【***】
        数据
        自动分析获得模型
        预测
        从数据中自动分析获得模型,并利用模型对未知数据进行预测
    2.工作流程【****】
        1.获取数据
        2.数据基本处理
        3.特征工程
        4.机器学习(模型训练)
        5.模型评估
    3.获取到的数据集介绍【*****】
        1.专有名词
            样本
            特征
            目标值(标签值)
            特征值
        2.数据类型构成
            类型一:特征值+目标值
                目标值分为是离散还是连续
            类型二: 只有特征值,没有目标值
        3.数据划分
            训练数据(训练集) -- 构建模型
                0.7--0.8
            测试数据(测试集) -- 模型评估
                0.2--0.3
    4.数据基本处理
        对数进行缺失值、去除异常值等处理
    5.特征工程
        1.定义
            把数据转换成为机器更容易识别的数据
        2.为什么需要特征工程
            数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已
        3.包含内容
            特征提取
            特征预处理
            特征降维
    6.机器学习
        选择合适的算法对模型进行训练
    7.模型评估
        对训练好的模型进行评估

二.机器学习的算法分类

    1.监督学习 -- 有特征值,有目标值
        目标值连续-- 回归
        目标值离散-- 分类
    2.无监督学习 -- 仅有特征值
    3.半监督学习
        有特征值,但是一部分数据有目标值,一部分没有
    4.强化学习
        动态过程,上一步数据的输出是下一步数据的输入
        四要素:agent, action, environment,Reward,

在监督学习中,若产生的目标值为连续则为回归问题,若目标值为离散的则是分类问题

三.模型评估

 1.分类模型评估
        准确率
        精确率
        召回率
        F1-score
        AUC指标
    2 回归模型评估
        均方根误差
        相对平方误差
        平均绝对误差
        相对绝对误差
        决定系数
    3.拟合
        欠拟合
        过拟合

拟合:

 

欠拟合:机器学习到的天鹅特征太少了,导致区分标准太粗糙,不能准确识别出天鹅。

过拟合:

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值