吃瓜记录
pikapi10
这个作者很懒,什么都没留下…
展开
-
2.模型评估与选择
2.1 经验误差与过拟合1、m样本个数,a个错误样本错误率E=a/m精度1-E误差:实际与样本输出差异训练误差:训练集上误差泛化误差:新样本上误差2、过拟合:泛化能力下降,学太好(无法避免)欠拟合:一般性不完好2.2评估方法1、测试集:测试误差近似泛化误差(测试样本不在训练集出现,新)2.2.1留出法:多次随机划分、重复实验取平均值2/3~4/5用于训练,剩余测试训练集和测试集保持数据分布一致2.2.2 交叉验证法...原创 2022-05-16 22:23:51 · 97 阅读 · 0 评论 -
1.瓜绪论
1.1机器学习:通过计算的手段,改善系统性能内容:从数据中心产生模型(这个过程称为学习或训练),即学习算法1.2 术语数据集:记录的集合样本:关于一个对象事件的描述属性、特征;属性值:属性上的取值;属性空间、样本空间特征向量---d个属性(d维特征向量),d维样本空间学习、训练:从数据中心学得模型的过程模型:分类(预测离散值)-- 二分类、多分类 --无监督学习 回归(预测连续值)-- 输出空间y=R -- 无监督学习聚类(自动形成簇cluste...原创 2022-05-16 17:13:56 · 197 阅读 · 0 评论