01、机器学习--基本概念

1、监督和非监督机器学习

分类·、会给、聚类和密度估计的机器学习算法
监督学习
k近邻算法线性回归
朴素贝叶斯算法局部加权线性回归
支持向量机Ridge回归
决策树Lasso最小回归系数估计
无监督学习
k均值最大期望算法
DBSCANParzen窗设计

2、如何选择合适的算法

我们·在实际中使用算法考虑两个问题:

    一、使用机器学习的目的,想要算法完成何种任务

       如果想要预测目标变量的值,则可以选择监督学习算法,否则选择非监督学习算法。

       如果选择监督学习算法,需要进一步确定目标变量类型,如果是离散型,则可以选择分类算法;如果是连续型的数值,则需要选择回归算法。

     二、需要分析或者收集的数据

      对数据了解越充分,我们越能创造实际相符合的程序,主要需要了解数据一下特征:

       特征值是离散型变量还是连续性变量。

       特征值中是否有缺失的值,造成缺失的原因是什么。

       数据中是否有异常的值。

       某个特征发生的频率(出现的次数)。

通过以上两种筛选,我们只能一定程度缩小算法的范围,一般不存在最好的算法,我们需要执行不同的算法进行比较(性能、准确率等等)

3、机器学习程序开发步骤

      1.收集数据,如通过网络爬虫获取数据

      2.准备输入数据,在收集数据后,我们必须保证数据的格式符合要求

      3.分析输入的数据,该步骤主要是确保前两步的有效性,确保数据集中没有垃圾数据。如查看数据是否有空值,是否有明显的异常值等。

      4.选择算法,监督还是非监督算法

      5.测试算法,为了评估算法,必须测试算法的效果。对于监督学习,必须已知用于评估算法的目标变量值;对于无监督学习,必要用其他的评测手段来检验算法的准确率。

      6.使用算法,讲机器学习的算法转换成应用程序,执行实际的任务,以检验以上步骤是否可以在实际环境正常工作。

    

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值