有幸用最近两个月的业余时间把”统计机器学习”一书粗略的学习了一遍,同时结合“模式识别”、“数据挖掘概念与技术”的知识点,对机器学习的一些知识结构进行梳理与总结:
机器学习包括两个主要问题1、学习什么,2、怎么学习。
首先来梳理一下学习什么
一、学习什么
1. 要解决什么问题?机器学习中主要解决以下三类问题:
a) 监督学习问题:给定输入输出集(即人工标记的样本集合),使用这一数据集对某一选定的模型进行训练,训练得到的模型能够对新的输入预测其输出。具体的预测任务包括分类问题、标注问题及回归问题。 b) 半监督学习问题:使用部分人工标记的样本和部分未人工标记的样本组成的样本集对模型进行训练,训练得到的模型能够对新的输入预测其输出。 c) 非监督学习问题:对未经过人工标记的样本进行学习,以发现数据中的结构性知识。聚类分析、关联分析都属于这一类问题。
2. 学习哪种模型:针对具体问题选取切实可行的模型与方案
以下列举了各类学习问题中基本的模型,实际应用中的模型多是