机器学习中的一些基本概念:
1.机器学习就是在计算机上用数据产生模型的算法.
2.机器学习的目的是使通过学习得到的模型适用于新样本,而学得的模型适用于新样本的能力被称为泛化能力,泛化能力越强,越能很好的适应整个样本空间,即对整个空间能够有很好的识别精度。
3.机器学习要从数据中找到规律,数据是由一个个特征向量组成,m个数据集可以表示为D={
X1,X2,···,Xm},每一个数据Xi(m>= i >=1)都是d(d>=1)维的向量,
Xi可以表示为
Xi={Xi1,Xi2,···,Xid},Xij表示的是第i个样本的第j个属性的取值。
4.归纳:从具体事实总结一般性规律的过程。演绎:从一般性规律到特殊化的过程。
5.没有免费的午餐定理:无论学习算法a有多优秀,而学习算法b有多笨拙,其实他们的期望性能是相同的。也就是说我们讨论一个具体问题的时候,得到的算法a可能比算法b更好,但是我们讨论另外一个具体问题的时候,算法a可能会比算法b更差。脱离具体问题而去讨论什么算法更好是毫无意义的。