机器学习基本方法:
1.模型评估与参数选择:
1.通过损失函数来衡量误差。
2.泛化误差是衡量模型泛化能力的标准。
3.使用训练集、验证集和测试集来避免过拟合。
数据集划分:
1.小样本集(几万量级):比例为6:2:2(训练集:验证集:测试集)。
2.大数据样本集(百万级以上):验证集和测试集各1w条数据。
3.代码示例展示如何将数据集划分为训练集、验证集和测试集。
监督学习与非监督学习:
1.监督学习利用带有标签的输入输出二元组,非监督学习则没有输出标签。
回归问题:
1.输出为连续值。
2.均方误差损失函数(MSE)用于度量效果。
分类问题:
1.输出为离散值。
2.使用精确率、召回率和F1分数等指标进行评估。