开始学习机器学习,在这里写下对于机器学习的理解和感想,不定时跟新!
机器学习,主要是让机器去学习对于人类来说很简单的,但是对于机器来说却十分复杂的东西,比如说图像识别,语言认知等。解决办法就是允许机器从经验的角度或者层次的概念上。
机器学习主要有基于知识的和基于数据的两种,基于知识的机器学习要求对需要解决的问题有完整的,准确的描述。而基于数据的机器学习则是从数据中提取有用的信息,称为特征,从而根据已有的经验做出决策,所以基于数据的机器学习一般也伴随着大数据等。这里讲的也主要是基于数据的,从数据中学习经验的机器学习。
早期的机器学习方法需要人为提取特征。比如说医生告诉算法有关孕妇子宫的信息(是否有伤口等),算法可以给出是否剖腹产的建议,但是算法一张孕妇子宫的CT图时,算法却不能给出任何建议,这就涉及的信息提取的问题了。选择什么样的特征对结果有很大的影响。
在设计特征或是用算法学习特征时,我们的目标通常是把能够表示目标数据的各个因素分开,这里的各个因素通常不是简单的相加,而且并不能直接获得,他们可能以不同于物理世界的方式存在,有时候也很难被理解。他们能够被理解为对数据的抽象。比如分析一个演讲录音时,特征可能包括演讲者的年龄,性别,用词,语气等。
一个困难是描述一个物体的因素并不是不变的,而且因为这个对机器判定有很大的影响,比如说一辆红色的车在晚上看时可能就是黑色的,看的角度不一样车的形状也不一样。这要求我们理清那些因素是我们需要的,那些事不关心的。而且,获取高度抽象的因素是很难的。
深度学习解决描述的问题是把一个问题用其他一系列更简单的问题的组合代替。比如把一张人的照片分成轮廓和角落等。
对于深度学习的一种观点就是深度学习就是学习怎么正确地表示数据。另一种观点是深度学习允许计算机学习一个多层次的程序。每一层的计算依靠之前层的输出。怎么去描述深度学习的深度,一种是从计算的角度,一种是从概念的角度。
人们研究神经网络主要有两个目的,一个是通过研究神经网络模型理解人脑或其他动物大脑的工作原理,另一种目的是通过神经网络模型去解决实际问题。
深度学习最早期的时候,主要是用简单的线性模型直接将输入层和输出层连接起来,通过计算权值的方式之间输出。