从数据反推公式
假设我们获得了这样一张表格,上面列举了美国纽约若干程序员职位的年薪:
大家可以看到,表格中列举了职位、经验、技能、国家和城市几项特征。除了经验一项,其他都是一样的。不同的经验(工作年限),薪水不同。而且看起来,工作年头越多,工资也就越高。
那么我们把 Experience 与 Salary 抽取出来,用 x 和 y 来分别指代它们。
它们是不是成正比的呢?y 与 x 没有比例关系,y 直接除以 x 肯定不行。
那么,是不是有可能是 y = a + bx 这样的线性相关关系呢?
我们可以先在二维坐标系里通过画图来看一下 x 与 y 的关系: