线性回归梳理
机器学习的基本概念:
定义:
机器学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析,简单点来说就是在历史数据中找出一定的规律,对其规律建立相应的数学模型,当输入新的数据时,通过模型的的计算输出期望的结果。
分类:
监督学习:
(supervised learning)监督式学习算法由一个目标变量(因变量)和用来预测目标变量的预测变量(自变量)。通过这些变量构建一个模型,输入一个任意变量,可以得到对应的预测变量。不断重复训练这个模型,调整参数,在训练数据集上达到较高的准确度。
属于监督式学习的算法有:回归模型,决策树,随机森林,K邻近算法,逻辑回归等。
无监督学习:
(unsupervised learning)与监督学习不同的是,无监督学习中我们没有需要预测或估计的目标变量。无监督式学习是用来对总体对象进行分类的。
属于无监督学习的算法有:关联规则,K-means聚类算法等。
其他概念介绍:
泛化能力:(generalization ability)是指学习得到的模型对未知数据的预测能力,是学习方法本质上重要的性质,现实中采用最多的方法是通过测试误差来