机器学习:数据集和机器学习导论

第一部分:数据集

一.常用概念

每行叫做样本或实例,每列(除最后一列)叫做特征或属性,最后一列为标签列,表示样本所属类别;
属性(特征)空间----由特征张成空间的维度;
特征或属性向量----组成特征或属性空间中的样本点(行);
特征或属性值----组成特征向量中的值;
泛化误差----学习器在新的样本上的误差。
如果数据非数字,需要通过labelen-coder标签编码或onehot-encoder编码(只有一位为1)转换为数据型变量。

二.对二分类问题进行评价

绝对值误差函数;平方误差函数;训练误差;测试误差;泛化误差;矩阵。
矩阵:
在这里插入图片描述
1)准确率Accuracy=(TP+TN)/all
2)精确率Precision=TP/(TP+FP)
3)召回率=真正率TPR(True Positive Rate)=TP/(TP+FN)
4)假正率FPR(False Positive Rate)=FP/(FP+TN)
5)F1-score(精确率和召回率的调

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值