《机器学习实战》笔记01~学习算法前的准备

12 篇文章 0 订阅
8 篇文章 0 订阅

《机器学习实战》笔记

1.机器学习算法的用途

监督学习
算法用途
K-近邻算法线性回归
朴素贝叶斯算法局部加权线性回归
支持向量机Ridge回归
决策树Lasso最小回归系数估计
无监督学习
算法用途
K-均值最大期望算法
DBSCANParzen窗设计

2.选择算法的依据

  1. 使用算法的目的,要完成的任务是什么样的
  2. 要收集并分析的数据是什么样的
目的算法
预测目标变量的值监督学习
目标变量为离散型分类器算法
目标变量为连续型回归算法
目的算法
不需要预测目标变量的值无监督学习
仅将数据划分为离散的组聚类算法
估计数据与离散的组的相似程度密度估计算法

3.应该了解的数据特性

  1. 特征值是离散型还是连续型
  2. 特征值中的缺失值和异常值
  3. 特征值发生的频率

4.开发机器学习应用程序的步骤

  1. 收集数据(爬虫,API等)
  2. 保证输入数据的格式符合要求
  3. 分析输入数据,数据清洗
  4. 训练算法(无监督学习不需要训练)
  5. 测试算法,不满意测试结果就返回上一步继续训练算法
  6. 使用算法,执行任务
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值