机器学习笔记

本文介绍了机器学习的基础概念,包括从数据中学习规律、模型选择与训练、评估模型性能。强调了特征工程的重要性,如数据清洗、预处理和选择,以及模型的分类,如有监督和无监督学习。还提到了KNN算法和K折交叉验证。最后,讨论了回归模型的评价指标,如MSE。
摘要由CSDN通过智能技术生成

一、什么是机器学习?官方解释:

机器学习就是从【数据】中自动分析获得【规律(模型)】,并利用规律对未知数据进行【预测】。

二、机器学习开发流程

1.数据采集

公司内部产生的数据

和其他公司合作获取的数据

购买的数据

2.分析数据所对应要解决需求或者问题是什么?根据目标数据推断问题属于回归还是分类

3.数据的基本处理

数据清洗

合并

级联等

4.特征工程:对特征进行处理

特征抽取

特征预处理

降维等

5.选择合适的模型,然后对其进行训练

6.模型的评估

7.上线使用

三、模型:

        - 算法模型,是一个特殊的对象。该算法模型对象中已经集成或者封装好了某种形式的方程/算法。(还没有求出解的方程)

四、模型的作用:

        - 预测:可以通过方程或者算法产生一个新的未知的数据/事物

        - 分类:可以将一个未知归类的事物给其归属到一个已有的类群中。

        - 注意:算法模型对应的算法或者方程求出的解就是预测或者分类的结果。

五、样本数据:

        - 模型的训练:将样本数据带入到模型中,对其进行训练(给方程进行求解操作),模型训练好了后,则模型的方程就有唯一的解或者最优解。有解后则模型就可以实现分类或者预测的功能。

六、本数据(数据集)的载体:

    - 通常情况下历史数据都不会存储在数据库中,而是存储在文件中(csv文件)

    - 数据库存

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值