以下是学习记录,以备忘记
===========================================
上篇说到,想让太极狗对刺激有反应。反应只有两种,所以是一个二分类问题
整理下:
1、最初目标问题:将数据分成两份。如何分?
2、分成两份可以画条直线,弯线,这里先只考虑直线,非线性分类以后再说。
在线上方一类,在线下方一类(不考虑线上了),自然就能分开数据,
问题转化为求a和b的值问题。只要有二个一元一次方程组却可,即只要有两组数据即可。
但是这样的线太多,如何选择最好的那条?问题转化为求最优解问题。
3、那么最优的标准是什么?
尽可能去体现数据区域之间的疏密关系。
上篇还有一个问题没有讲到,就是误分问题,要是一个数据误分了呢?
真真假假,数据并不全是事实。如果一个计算得到的结果是1,然现实中却是0,那中么办呢?
那么如何求最优解呢?
批梯度下降算法,随机梯度下降算法,最小二乘法。。。
还是没有理解透最优解的定义是什么,所以再悟下,之后接着写