机器学习一脸懵笔记【01】我如何开始?

2020.02.05 新增一个好的入门建议

机器学习入门

机器学习入门的最佳建议(5步)

步骤1:调整心态。相信您可以练习并应用机器学习。

★自上而下的学习方法(不同于常规大学学习方法)★

  1. 不要从定义和理论开始。相反,首先将主题与所需的结果联系起来,然后说明如何立即获得结果。布置一个计划,该计划侧重于实践获取结果的过程,根据需要更深入地研究某些领域,但始终要在它们要求的结果范围内。
  2. 如果采取这种方式,请注意不要使用传统的思维或比较方式。您只有在停止时才会失败,刚开始时结果可能很差,但是随着实践的进行会有所改善。它需要学习者对不断的学习和发现保持开放的态度,并负责改进。学习者必须注意他们感兴趣的内容并遵循它。
  3. 我们希望成为技术人员,在实践中使用这些工具来帮助人们,而不是成为研究人员。您无需涵盖所有相同的领域,因为您有不同的学习目标。尽管您可以在拥有集成抽象知识的上下文后回头学习任何您喜欢的东西,但没必要。工业界的开发人员不是计算机科学家。他们是工程师。他们是手工艺的骄傲。
  4. 这样做的好处:①您直接去做自己想要的事情,然后开始练习;②您拥有连接更深的知识甚至理论的环境;③您可以根据您在主题中的目标有效地筛选和过滤主题。世界一流的从业人员会告诉您这是他们学习并继续学习的方式。

★如何思考机器学习★

  1. 机器学习是一个广泛的研究领域,如果您专注于解决问题,那么并不是所有的学习都与您相关。放大您在实际工程和解决问题中真正需要了解的机器学习方面。
  2. 机器学习领域涉及如何构建随经验而自动改进的计算机程序的问题。机器学习是一项广泛而广泛的研究计划,学习类型很多,可以学习的反馈类型很多,可以学习的东西很多。例如:
    -开发代码以调查生物种群如何在进化过程中“学习”以适应其环境。
    -开发代码以研究大脑中的一个神经元如何响应其他神经元的刺激而“学习”。
    -开发代码以调查蚂蚁如何“学习”从家到食物的最佳路径。
  3. 人工智能呢?
    机器学习是人工智能的一个子领域。智力涉及学习,例如机器学习,但可能涉及其他问题,例如推理,计划,记忆等等。我们可以将机器学习轻松地称为人工学习,以与人工智能保持一致(帮助初学者)。他们的界限模糊,机器学习问题也是人工智能问题。
  4. 那么统计呢?
    统计是数学的一个子领域,与描述和理解数据中的关系有关。这可能包括多种学习类型,例如:
    -开发模型以总结变量的分布。
    -开发模型以最好地描述两个变量之间的关系。
    -开发模型以测试两个观测值之间的相似性。
    机器学习中可以使用许多用于理解统计数据的方法来学习数据模式。这些任务可以称为机器学习或应用统计。
  5. 您需要关注机器学习的哪些部分?
    -就您要解决的问题而言。
    -根据您需要的解决方案。
  6. 我的部落:工程部落
    1)对实现算法感兴趣的程序员
    2)开发人员对交付一次性预测感兴趣
    3)对开发更智能的软件和服务感兴趣的工程师

步骤2:选择一个流程。使用系统的过程来解决问题。
在本文中,我想与您分享解决机器学习问题的过程的基本原理。您可以将其用作下一个项目的起点或模板。(From Jason Brownlee)
五步系统处理:
(1)定义问题
(2)准备数据
(3)抽查算法
(4)改善结果
(5)目前的结果

(1)定义问题。三步过程来定义问题。
步骤1:有什么问题?非正式地和正式地描述问题,并列出假设和类似问题。
步骤2:为什么需要解决此问题?列出解决问题的动机,解决方案提供的好处以及解决方案的使用方式。
步骤3:我该如何解决问题?描述如何手动解决问题以刷新域知识。
(2)准备数据。我以数据分析阶段作为数据准备的序幕,该阶段包括汇总属性并使用散点图和直方图将其可视化。实际的数据准备过程分为以下三个步骤:
步骤1:数据选择:考虑可用的数据,丢失的数据和可以删除的数据。
步骤2:数据预处理:通过格式化,清理和采样所选数据来组织所选数据。
步骤3:数据转换:使用缩放,属性分解和属性聚合,通过工程特征转换准备用于机器学习的预处理数据。
(3)抽查算法。默认情况下,我在测试工具中使用10倍交叉验证。将所有实验(算法和数据集组合)重复10次,并收集和报告准确性的均值和标准差。
如何评估机器学习算法——https://machinelearningmastery.com/how-to-evaluate-machine-learning-algorithms/
(4)改善结果。经过抽查,是时候挤出最佳结果了。为此,我对性能最高的算法的参数进行了自动敏感性分析。我还使用性能最佳的算法的标准集成方法设计和运行实验。改善结果的过程涉及:
-算法调优:通过模型参数空间将发现最佳模型的过程视为搜索问题。
-合奏方法:组合多个模型的预测。
-极端功能工程:将数据准备中看到的属性分解和聚合推到极限。
(5)目前的结果。
用来表示结果的模板如下,该模板可以采用文本文档,正式报告或演示幻灯片的形式。
1.背景(为什么):定义存在问题的环境,并设置研究问题的动机。
2.问题(问题):将问题描述为您出去回答的问题。
3.解决方案(答案):简要描述解决方案,作为对上一节中提出的问题的解答。请明确点。
4.结果:项目符号清单,列出了您感兴趣的发现方式。它们可能是数据,有效或无效方法的发现,或者是您在整个过程中获得的模型性能收益。
5.局限性:请考虑该模型不起作用的地方或该模型不能回答的问题。不要回避这些问题,如果可以定义不擅长模型的地方,那么定义模型最擅长的地方会更受信任。
6.结论(为什么+问题+答案):在一个紧凑的小包装中重新查看“为什么”,研究问题和发现的答案,这些小包装易于记忆并为自己和他人重复。

步骤3:选择一个工具
Python机器学习迷你课程(14天速成!!)——https://machinelearningmastery.com/python-machine-learning-mini-course/
该课程包含一些基本的讲解和代码,可以试试!

步骤4:练习数据集。选择要处理的数据集并实践该过程。
步骤5:建立投资组合。收集结果并展示您的技能。
——————————————————————————————————————
2020.01.23第一版

注意:步骤4、5暂时用不到,以后参考【https://machinelearningmastery.com/start-here/#process】进行学习,此外第一次学习有很多没看懂的内容,可能需要后续返工。

本节笔记对应Jason Brownlee博士网页【地基-我如何开始?】

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值