别急我们先了解下机器学习的基本概念:
机器学习:
机器学习的主要流程就是神经网络架构,由神经元组成,神经元通过神经元公式
f(sum(x * w ) + b) 输入特征 乘以 输入权重 求和 加上 偏差 再过一下激活函数最后就会出现一个结果。
第一原则:输入的特征 和 预测结果存在因果关系, 没有因果关系就是脏数据会影响机器学习
的预测结果。
神经元公式:f(sum(x * w ) + b)
假设结果为10 数据可能为 特征 x = 2 权重 w = 4 偏差 b=2 算出结果为 10。
含义:
x : 特征
特征的选取:
机器学习最关键的是特征的提取。 比如我要识别螃蟹,就不能以颜色作为螃蟹的特征,
因为在于螃蟹不是只有一种颜色。不能想训练什么就无脑的往里面灌数据,神经元公式有一个最最
大的前提就是 。 参数和特征必须有因果关系。我以颜色作为螃蟹的特征,进行识别所有的螃蟹
都是红色的,这显然是不对的,所以这两个没有因果关系。比如我可以把特征改为,八条腿或者横着走。然后得出结论所有的螃蟹都有八条腿,这显然是存在因果关系的。最忌讳的是特征提取不明显,就不停的给他传,这样会严重影响他的判断,出现脏数据。
w: 权重
所有的特征都不是平行关系,都有优先级。 比如我要识别螃蟹 特征1 是八条