如何选择合适的算法以及开发机器学习应用的步骤(2019/07/15学习总结)

选择算法:

算法的选择必须要考虑两个问题:
一、使用机器学习算法的目的是什么,想要算法完成何种任务。
如果想要预测目标变量的值,则可以选择监督学习算法,否则可以选择无监督学习算法。确定为监督学习算法后,需要进一步的确定目标变量的数据类型,如果是离散型数据可选择分类算法,如果是连续型数据可采用回归算法。大多数情况下上述方法是可行的,但也不是必须的,特殊情况下也可以使用分类算法来解决回归问题。
二、需要分析或者收集的数据是什么。
开始分析之前需要充分的了解数据,主要了解以下一些特性:特征值是离散还是连续,特征值中是否存在缺失值以及缺失原因,数据中是否存在异常值,某个特征发生的频率如何等等。
注意,我们只能在一定程度上缩小算法的选择范围,一般并不存在最好的算法或者可以给出最好结果的算法,同时还要尝试不同算法的执行结果。一般来说,发现最好算法的关键环节是反复试错的迭代过程。

开发机器学习应用程序的步骤:

1.收集数据(获取数据,方法有爬虫,设备实测数据等)
2.准备输入数据(数据要符合格式,string转int或者int转string)
3.分析输入数据(人工分析得到的数据,检查是否存在空值或异常值,将数据按照分析需求正则化、标准化或归一化,PCA特征降维,去除对结果无影响或影响较小的维度(特征),此步骤即为对原始数据的人工干预)
4.训练算法(机器学习算法从这一部开始真正学习,输入数据,调节算法的各种参数)
5.测试算法(算法的评估,测试算法的工作效果。对于监督学习,必须已知用于评估算法的目标变量,对于无监督学习,也必须用其他手段来检验算法成功率。如果结果不甚满意,则可以返回第四步改正并继续测试。如果问题与数据的收集与处理有关,则需返回第一步重新开始)
6.算法的使用(将机器学习的算法转换为应用程序,执行实际任务,以检验上述步骤是否可以在实际环境中正常工作。后期如遇到新的数据问题还要继续调整算法)

参考资料:
《机器学习实战》-------[美]Peter Harrington

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值