机器学习的两大算法:监督学习和非监督学习:
1.监督学习:我们给数据集让程序进行模拟
2.非监督学习:
1.监督学习:给出分类的标准让程序对数据集进行分类,可能会使用无穷多的特征来进行拟合。对于数据集中的每个样本,若想通过算法预测并得到解决问题的正确答案。这要通过思考回归问题(regression problem)和分类问题,回归是指我们的目标,是预测一个连续值输出;思考分类问题(classification problem)的目的是预测离散值输出。
2.非监督学习(unsupervised learning):与聚类算法相像,没有告诉这个算法每一对象分类的依据和分类特征,要程序对没有任何特征的数据集自己自动进行按照一些相同的特征进行分类。
一些符号的含义:
m:表示训练样本的数量
x:代表输入变量(特征)
y:表示输出变量(要预测的目标变量)
(x,y):表示一个训练样本
(x^(i),y^(i)):表示第i个训练样本
单变量线性回归函数:线性方程
等高线图
最小化线性回归的代价函数J的意义:图像的不同的点的组合值可以代表不同的回归曲线,而J值最低的参数所代表的回归函数与实际训练样本最契合。