目录
一 机器学习过程
1)
二 机器学习理论
1)机器学习理论基础
2)问题性质方面:机器学习研究的问题具有高度的不确定性和高度的复杂性,当当下知识不能给出准确答案,从数据里面分析,得到想要的数据结果,故所得出的数据误差率达不到100%
3)计算要求方面:以很高的概率得到很好的模型,概率近似正确。
4)拓展:什么是P = NP?问题
P指多项式时间(Polynomial),一个复杂问题如果能在多项式时间内解决,那么它便被称为P问题,这意味着计算机可以在有限时间内完成计算;
NP指非确定性多项式时间(nondeterministic polynomial),一个复杂问题不能确定在多项式时间内解决。
三 基本术语
1)基本术语
1.测试数据和训练数据应该分开,不能用训练数据测试
2.样例有结果,示例是没有结果的
2)每一个模型都对应了:假设(数据模型得到的结果可能的规律) 真相 (真实的结果) 学习器
3)监督学习和无监督学习:
监督学习是有期望结果,无监督学习是没有期望结果的
四 泛化和拟合
一)归纳偏好![](https://img-blog.csdnimg.cn/09894b13bf1e47ca908895a496518697.png)
二)NFL定理
具体问题,具体分析!按需设计,度身定制
三)泛化能力
1)泛化能力:机器学习算法对于没有见过的样本的识别能力。我们也叫做举一反三的能力,或者叫做学以致用的能力。
2)泛化误差:在“未来样本”上的误差
3)经验误差:在“训练集上的误差”
四)过拟合和欠拟合
1)
五 三大问题
一)评估方法:
1)关键:如何得到测试集(与训练集互斥)
2)“调参”与最终模型
二)性能度量
1)