从数据反推公式
假设我们获得了这样一张表格,上面列举了美国纽约若干程序员职位的年薪:
大家可以看到,表格中列举了职位、经验、技能、国家和城市几项特征。除了经验一项,其他都是一样的。不同的经验(工作年限),薪水不同。而且看起来,工作年头越多,工资也就越高。
那么我们把 Experience 与 Salary 抽取出来,用 x 和 y 来分别指代他们。
它们是不是成正比的呢?y 与 x 没有比例关系,y 直接除以 x 肯定不行。
那么,是不是有可能是 y = a + bx 这样的线性相关关系呢?
我们可以先在二维坐标系里通过画图来看一下 x 与 y 的关系:
当我们用6个点在坐标系里标注出工作年限从0到5的工资收入后,发现:把这6个点连起来,基本上就成了一条直线。那么假设存在 y = a + bx,是合理的。
既然是条直线,又有现成的 x = 0 的情况 103100 = a + b * 0,