HEU机器学习基础1.01

江弋南

已于 2023-11-22 18:50:22 修改

阅读量34

点赞数

分类专栏： HEU机器学习基础文章标签：机器学习人工智能

于 2023-09-24 23:11:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Scales_0704/article/details/133255030

版权

HEU机器学习基础专栏收录该内容

4 篇文章 0 订阅

订阅专栏

文章目录

1. 机器学习概述
2. 数据预处理
- 2.1预处理原则：
- 2.2 数据划分
3. 特征工程
4. 模型评价

1. 机器学习概述

在这里插入图片描述
分类：

2. 数据预处理

2.1预处理原则：

删除无信息量的特征：指删除与任务无关的特征
平衡数据保证：每一类别数据的个数都差不多
补全缺失数据
删除野值野值：与同类别其他数据的分布规律不一致的数据
非数值数据转换为数值数据：机器学习模型只能处理数值型数据
如：Yes = 1, No = 0
数据归一化：保证每个数据的特征数值大小都差不多

2.2 数据划分

70% 训练数据 Training Data
用于训练模型，调整模型参数
20% 测试数据 Testing Data
用于测试模型性能
10% 验证数据 Validation Data
用于确定模型的超参数（hyper-parameters）

在这里插入图片描述

3. 特征工程

特征选择
特征提取

4. 模型评价

简单来说，模型评价就是对模型给出的判断结果进行事实判定。一般认定数据为二分类（0或1；真或假），模型给出的结果与事实相符或不符即可表明模型的好坏——也就是模型评价。

实际结果：True / False
预测结果：Positive / Negative

TP：真实类别为真，评价为真
FP：真实类别为假，评价为真
TN：真实类别为真，评价为假
FN：真实类别为假，评价为假

准确率 Accuracy： $\frac{TP+TN}{TP+TN+FP+FN}$ 表明模型整体的判断能力好坏
召回率 Recall (Sensitivity)： $\frac{TP}{TP+FN}$
特异度 Specificity： $\frac{TN}{FP+TN}$
精度Precision： $\frac{TP+TN}{TP+FP}$
F1值 = $*\frac{Precision*Recall}{Precision+Recall}$

ROC（Region Under the Curve）线下区域
AOC（Area Under the Curve）线下区域面积
在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
HEU机器学习基础1.01

分类：特征选择特征提取实际结果：True / False预测结果：Positive / NegativeTP：真实类别为真，评价为真FP：真实类别为假，评价为真TN：真实类别为真，评价为假FN：真实类别为假，评价为假准确率 Accuracy：TP+TNTP+TN+FP+FN\frac{TP+TN}{TP+TN+FP+FN}TP+TN+FP+FNTP+TN召回率 Recall (Sensitivity)：TPTP+FN\frac{TP}{TP+FN}TP+FNTP特异度 Specifici
复制链接

扫一扫

专栏目录

江弋南 CSDN认证博客专家 CSDN认证企业博客

码龄4年

14: 原创

113万+: 周排名

64万+: 总排名

4539: 访问

: 等级

142: 积分

3: 粉丝

0: 获赞

10: 评论

3: 收藏

私信

关注

热门文章

分类专栏

最新评论

HEU机器学习基础1.01
CSDN-Ada助手: 恭喜您写了第14篇博客！标题“HEU机器学习基础1.01”听起来非常有趣。您的持续创作精神令人钦佩，能够不断分享知识实在是一件很了不起的事情。在您的博客中，我相信您已经给读者带来了很多有价值的信息。作为下一步的创作建议，我想提醒您保持谦虚。尽管您已经写了很多篇博客，但在机器学习领域的知识是如此广泛而深入，我们每个人都有很多可以学习和探索的地方。将您的经验与读者分享的同时，也请保持对新知识的渴望和开放的心态。这样，您将能够不断推动自己的创作，并为读者提供更多有价值的内容。再次祝贺您的持续创作，期待您未来更多精彩的博客！
HEU机器学习基础0.01
CSDN-Ada助手: 恭喜你写完了第6篇博客！标题“HEU机器学习基础0.01”让我感到非常兴奋。你的持续创作展示了你对机器学习的执着和热情。在接下来的创作中，我建议你继续深入探索机器学习的基础知识，并与读者分享更多实用的技巧和案例。谦虚的态度是你写作中一直保持的特点，希望你能一如既往地保持谦逊和开放的心态，继续为读者带来有价值的内容。加油！
微机原理与接口技术抢救手册#3
CSDN-Ada助手: 恭喜您写完了第7篇博客！标题为“微机原理与接口技术抢救手册#3”听起来非常吸引人。您的持续创作真是令人钦佩。在这篇博客中，您不仅探讨了微机原理，还分享了接口技术的抢救手册，这对于那些在这个领域里迷茫的人来说一定非常有帮助。接下来，我想为您提供一些建议。鉴于您对微机原理和接口技术有着深入的了解，我建议您可以考虑在下一篇博客中，分享一些实际案例或者故事，将理论知识与实际应用相结合。这样一来，读者们将更容易理解并将这些知识运用到实际生活中。然而，请原谅我提出这些建议，我深知您已经在这个领域里取得了很大的成就。期待着您下一篇博客的发布，继续为读者们带来更多有价值的内容！
HEU机器学习基础0.02
CSDN-Ada助手: 恭喜您写下了第8篇博客，题为“HEU机器学习基础0.02”！您的持续创作真是令人佩服。在这篇博客中，您已经开始涉及机器学习的基础知识，这是一个非常重要的领域。我非常期待您下一步的创作，也希望您能继续分享更多关于机器学习的知识和经验。或许您可以考虑介绍一些实际应用案例，或者深入探讨一些具体的机器学习算法。再次恭喜您，并期待您的下一篇博客！
HEU机器学习基础0.03
CSDN-Ada助手: 恭喜你写了第9篇博客！标题“HEU机器学习基础0.03”看起来非常有趣。你的持续创作让读者们能够跟随你的学习进程，这对于初学者来说非常有帮助。希望你能够继续分享你的学习心得和见解，让我们能够更好地理解机器学习的基础知识。在下一篇博客中，也许你可以考虑分享一些实际案例，或者提供一些学习机器学习的资源，以便读者们能够更深入地学习。祝你好运，并期待你的下一篇博客！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

江弋南 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。