分类问题
输出为有限个离散值的监督学习,输入可以是连续或者离散的。二类分类和多类分类。
二类分类的四种情况
(T/F表示预测结果是否正确,P/N表示预测结果的值)
TP - 将正类预测为正类
TN - 将负类预测为负类
FP - 将负类预测为正类
FN - 将正类预测为负类
精确率、召回率和F1
精确率: 预测正确的正类与预测结果为正类的比例
precision = TP / (TP + FP)
召回率:预测正确的正类与实际的正类的比例
recall = TP / (TP + FN)
F1: 精确率和召回率的调和平均数
2 / F1 = 1 / precision + 1 / recall
标注问题
输入是一个观测序列,输出是一个标记序列。(给每一个输入打标签,标签可以有多个)
思考:条件概率分布
回归问题
输入变量到输出变量的一个函数映射
最常见的损失函数是平方损失函数,用最小二乘法求解。