初入机器学习(2)

今天先大致讲下机器学习的理论基础,基础术语和一些概念性的定义解释等。
首先是基础术语:
(1)数据集(data sets):是一个记录关于一个事件或者对象的集合,也就是我们的所需要的数据的一个集合,包括特征(feature)或者属性(attribute)等,当然如果是监督学校的话也包括标签(label)。
(2)特征向量(feature vector):如果把数据集放到excel中,那么每行就是一个实例(instance),每列就是他的特征属性,那么该实例的特征集合所组成的就是特征向量。因为就是1*n的一个向量。
(3)训练(trainning):这个名词应该是最熟悉不过的了,训练就是说把数据集中的一部分拿出来当作训练集(trainning sets),将每个实例都放入我们预先设定好的算法中,通过每一个实例,算法都会调节他自己的参数来进行学习训练 ,这样他就能在新的数据中能够更好的发挥效果。
(4)预测(prediction):预测和测试意思相同,都是指在调节好的模型中用测试集中的数据去进行检验,看该模型是否能够有效的进行预测。预测的过程不会调节模型的参数
(5)假设空间(hypothesis sets):这个空间其实也是一个集合,这个集合中是我们想要用来训练的各种算法模,通过这个空间,我们就能进行遍历来寻找最好的模型,这也就是我们的目的所在。
(6)归纳偏好(inductive bias):其实就是什么模型更好的问题,比方说在假设空间中找到多个在训练集上面效果比较好的模型,那么我们该如何选择模型呢。这就叫做归纳偏好,比如说拟合函数,如果用2次和3次函数拟的结果相同,根据奥卡姆剃刀原则(这就是一种偏好),我们就会选择 相对比较简单的2次函数。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值