机器学习-2(机器学习程序的步骤)

1 收集数据 

    这一块你要的知识是如何获得数据 如果不是自己的生产环境产生的真实数据,你还需要获得爬虫的技能,来从外部获取数据到自己的分析库。

 

2 准备输入数据

    这一块可以理解为数据转换,把数据格式转换为符合自己的。不近要匹配你的编程语言的习惯,而且要做到简化。还有一点就是还要匹配某些算法对数据格式的要求。这里就不细讲,到了相关知识点我相信大家都一目了然了

 

3 分析输入数据

   简单理解就是人工分析,单步调试的意义。人工去把数据拿出来观察,是否有空值,特殊的字符,特殊的样式,个别的异常值等等。这是为了排除垃圾数据,比如开发环境里面的脏数据。我们就叫做数据清洗吧。

 

4 训练算法

    此时我们将格式化的数据输入到算法,从中抽取我们想要的东西。我们就叫做数据抽取,然后记得要把抽取后的数据存储起来,方便我们后续使用。

5 测试算法

    这一步是为了评估算法,测试下我们的算法的工作效果。如何评估算法的成功率,这里就是我们测试人员需要关心的了

对于监督学习的话,我们就必须清楚目标变量的值。而对于无监督学习,我们可以根据具体情况用其他评测手段来验证算法的成功率。

 

6 使用算法

    这里我们就要把我们的算法集成到我们的系统中去,让它执行实际任务,用来检验在真实环境下是否能保持同样的成功率

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值