diamonds = pd.read_table("./diamonds.csv",sep=",")
diamonds.head()
上面的表格里提供了一份数据。它的目的是通过砖石的各个特性来预测其价格。我们尝试着使用多元线性回归来拟合这份数据。
在多元线性回归模型里,对于每一个特征,我们都会给它分配对应的参数。我们也可以把参数理解成是对于某一个特征的重要性。
如何求解多元线性回归模型的最优解。 这里需要涉及到线性代数相关的知识点:
先来回顾一下什么是向量(Vector)、什么是矩阵(Matrix)以及什么是张量(Tensor)?
标量:一个具体的值
向量:一维的数组(很多的数拼接在一起,然后把它整体上看做是一个向量)
矩阵:二维的数组(多个向量的集合)
张量:二维以上的数组
后面的内容以后再补充