(一)机器学习基本概念篇
什么是机器学习呢?
机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。但从实践的意义上来说,机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。
机器学习的定义
机器学习有下面几种定义:
(1) 机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。
(2) 机器学习是对能通过经验自动改进的计算机算法的研究。
(3) 机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。
传统的机器学习
机器学习(ML)技术在预测中发挥了重要的作用,经历了多代的发展,形成了具有丰富的模型结构。
比较常见的有:
- 线性回归
- 逻辑回归
- 决策树
- 支持向量机
- 朴素贝叶斯模型
- 正则化模型
- 模型集成(ensemble)
- 神经网络
这些预测模型中的每一个都基于特定的算法结构,参数都是可调的。
训练预测模型涉及以下步骤:
- 选择一个模型结构(例如逻辑回归,随机森林等)
- 用训练数据(输入和输出)输入模型
- 学习算法将输出最优模型(即具有使训练错误最小化的特定参数的模型)
机器学习的一般方法
整理了一张思维导图来表示,内容很多。
监督学习(Supervised Learning)
从给定的训练数据集中学习出一个函数(模型参数),当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求包括输入输出,也可以说是特征和目标。训练集中的目标是由人标注的。监督学习就是最常见的分类(注意和聚类区分)问题,通过已有的训练样本(即已知数据及其对应的输出)去训练得到一个最优模型(这个模型属于某个函数的集合,最优表示某个评价准则下是最佳的),