一、曲线拟合
1、问题引入
①假设现在有一份关于某城市的住房面积与相应房价的数据集
表1 居住面积与房价关系
图1 居住面积与房价关系
那么给定这样一个数据集,我们怎么学习出一个以住房面积大小为自变量的用于预测该城市房价的函数?
问题可形式化为
给定大小为m的训练样本集
我们希望学习的目标函数为
房价预测本质上是回归问题
a、回归分析挖掘自变量与因变量之间的关系
b、有监督的学习问题,所有的样本点都带有目标变量
c、输出变量为连续值,可取任意实数
②假设现在我们有份更详尽的数据集,它还记录了卧室的数量
输入,X=(x1,x2)
假设每个自变量都与因变量Y存在线性相关
目标是学习出假设函数
1、怎样建模
①基本概念
Relationship
l Linear correlated?
l Nonlinear correlated?
Mining relation
l Correlation coefficient
= 1时,称X,Y完全相关,X,Y之间具有线性函数关系
l Special Case
e.g. 猜想Y与X存在指数关系,观察
ln Y