目录
目录
一、什么是机器学习
1、定义:
机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分来有效提高学习效率。 [1]
机器学习有下面几种定义:
(1)机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。
(2)机器学习是对能通过经验自动改进的计算机算法的研究。
(3)机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。 [2]
------摘自百度百科
2.简单来说机器学习是计算机分析数据,得到模型,并且根据模型对新问题进行预测分析。
这个过程类似于人类对规律的总结和应用。
3.(数据集的结构:特征值+目标值)需要注意的是:
1)数据集中一行数据称为样本。
2)有些数据集可以没有目标值。(根据特征分组)
二、机器学习、深度学习的应用
1.传统预测
2.图像识别
3.自然语言处理
三、机器学习算法分类
1.有目标值--->监督学习(有标准答案)
分类:
1) 目标值->类别(离散型):分类问题 eg.预测明天是阴天还是晴天、人脸识别
算法举例:k-近邻算法,贝叶斯分类,决策树与随机森林,逻辑回归
2)目标值->数据(连续型):回归问题 eg.预测明天的平均气温、人脸年龄预测
算法举例:线性回归,岭回归
2.没有目标值--->无监督学习 (无标准答案)
算法举例:聚类k-means
四、机器学习开发流程
- 获取数据
- 数据处理
- 特征工程
- 机器学习算法训练
- 模型评估(好则进行下一步,不好就回到数据处理和特征工程再处理)
- 应用