机器学习笔记(一)绪论

1.绪论

1.1引言

机器学习致力于研究如何通过计算的手段,利用经验来改善系统自身的性能;经验,则以数据的形式存在,故而,机器学习所研究的,正是在计算机上从数据中产生模型的算法,即学习算法。基于学习算法和经验数据所产生的模型,可以应用到新情况的分析和判断。

机器学习是研究关于学习算法的学科,比较形式化的定义是:假设用P来评估计算机程序在某任务类T上的性能,若一个程序通过利用经验E在T中任务上获得了性能改善,则就说关于T和P,该程序对E进行了学习。

模型用以泛指从数据中学得的结果。模型指全局性结果,如一颗决策树;模型指局部性结果,如一条规则。机器学习是关于学习算法,通过学习算法,从经验中(样本数据中)训练出一个模型,并应用模型。机器学习的关心点就是学习算法,能够从经验中提取模型。

1.2基本术语

1)关于数据的术语

数据是经验的表示,是机器学习的基础。一个数据集是一组记录的集合,其中每条记录是关于一个事件或对象的描述,称为示例或样本。

反映事件或对象在某方面的表现或性质的事项,称为属性或特征,如姓名;属性或特征上的值,称为属性值,如张三;属性张成的空间成为属性空间或样本空间或输入空间或特征向量。如姓名、年龄、职业作为三个维度刻画一个人这样对象的特征,在三维空间中可以找到对应的点。

总结上这个关系,横向上,属性和属性值构成一个对象,一个对象就是一条记录,一组记录构成一个集合就是数据集,关系就是属性->记录->数据集;纵向上,属性和属性值构成一个对象&

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值