机器学习是非常宽泛的领域,其子领域的划分非常复杂。机器学习算法大致可分为四大类:
1)监督学习
2)无监督学习
3)自监督学习
4)强化学习
一、监督学习
监督学习是最常见的机器学习类型。给定一组样本(通常由人工标注),它可以学会将输入数据映射到已知目标【也叫作标注(annotation)】。
近年来广受关注的深度学习几乎都属于监督学习,如,光学字符识别,语音识别、图像分类和语言翻译。
监督学习主要包括分类和回归,还有很多奇特的辩题,主要包括如下几种:
1)序列生成(sequence generation)。给定一张图像,预测描述图像的文字。序列生成又是可以被重新表示为一些列分类问题,比如反复预测序列中的单词或标记。
2)语法树预测(syntax tree prediction)。给定一个橘子,预测其分解生成的语法树。
3)目标检测(object detection)。给定一个张图片,在图中特定目标的周围画一个边界框。这个问题也可以表示为分类问题(给定多个候选边界框,对每个框内的目标进行分类)或分类与回归联合问题(用向量回归来预测边界框的坐标)。
4)图像分割(image