很多的问题都分为回归和分类问题
回归和分类是通过数据训练一个模型,来进行结果的预测
回归问题针对的是连续的数据
分类问题针对的是离散的数据
比如预测房价就是一个回归的问题,房价是一个连续数据
比如预测一个房子里有多少房间,那么就是一个分类问题,它可以是一间或者是两间
线性回归和逻辑回归是一种算法
线性回归是回归问题,逻辑回归是其实是一种二分类分类问题。将线性回归的值映射到了sigmoid函数,当大于阈值的时候取1(正值),小于阈值的时候取0(负值)。
前面总结一些小概念,现在来说一下什么是线性回归
线性回归是可能是用一条线性的直线如y=ax+b,让训练的数据尽量在该条直上。当输入一个之前训练集没有的数据的时候就可以预测了结果了。但是呢并不是所有的数据都在这个回归方程中,所以我们需要看真实值和预测值之间的差距,我们就会构造一个损失函数。希望损失越小越好,这样子预测值和真实值就会越接近,为了让损失尽可能小,可以用梯度下降算法。这个算法这里先暂时不讲。
我简单的理解是大概3步
第一 找到预测函数,第二找到损失函数,第三让损失达到最小
我这里只是大概理了一下这些东西的关系。
有一篇博客感觉写道很好,推荐一下https://blog.csdn.net/alw_123/article/details/82193535