一、基本概念
机器学习也称为“统计机器学习”,学习的对象是“数据”。
从数据出发,经过数据清洗,特征工程(主要环节是特征提取),抽象数据的模型(传统机器算法和深度学习算法),进而发现数据中的知识,最终又回到对数据的分析与预测中去。
既然从数据出发,那么必然是多样的。目前工业界处理的对象主要是:文字(自然语言)、图片、音视频以及他们的组合。
二、前提-基本假设
机器学习的关于数据的基本假设是:同类数据具有一定的统计规律性,这是机器学习的前提。同类数据指的是:具有某种共同性质的数据,如:文章、网页、数据库中的数据。用随机变量描述特征,用概率分布描述数据的统计规律。
三、机器学习的目的
目的:通过 选择机器学习的算法模型+ 模型训练 ->能够对未知数据进行准确的预测与分析,并且能够不断的自我学习,提高学习效率。
四、机器学习的分类
1. 监督学习(supervised learning)
2. 非监督学习(unsupervised learning)
3. 半监督学习(semi-supervised learning)
4. 强化学习(reinforcement learning)