TPE定义
偷个懒,直接上图:
用自己的话来说就是通过对经验的学习机器在某项任务上干得越来越好(性能更高)。
学习类型
根据样本和标签的情况分为以下四类:
样本 | 标签 | 类型 |
---|---|---|
有 | 有 | 有监督学习 |
有 | 无 | 无监督学习 |
有 | 少量有+大量无 | 半监督学习 |
无 | \ | 强化学习 |
回归和分类都是有监督学习,聚类是无监督学习。这里不多讲,网上有很多资料。
组成部分
花书里的概念,觉得很精辟。4-21学完线性回归和逻辑回归,用上这个概念,化繁为简,good!
数据集
常言道:好的数据往往比算法更为重要。的确,数据是机器用来学习的经验,如果经验本身蕴含的规律就是不完整甚至不正确的,怎么能期待机器在未知的样本中给出正确的结果呢?
一个数据集有两部分:训练集(train)和测试集(test),训练集是让机器学习规律的,测试集是评价机器学习效果的。感觉有点像学生做的习题和考试题,对应的——我们更关心机器在测试集上的表现而不是在训练集上的表现。
模型
这部分就是我们真正要用的东西了,负责接收数据也就是特征,然后经过运算,输出结果,比如回归值,类别等。所谓模型,就是一个函数,表达了输入和输出之间的映射关系。
一开始怎么都搞不懂,训练了那么多轮,到底干啥了?其实就是在训练这个模型,这个模型的参数就是我们要训练的内容。
不同参数下模型表现会有很大不同,可能极