机器学习的概念和相关术语

woyaokaixing

已于 2023-08-20 12:50:08 修改

阅读量73

点赞数

分类专栏：人工智能文章标签：机器学习人工智能

于 2023-08-20 12:49:39 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/woyaokaixing/article/details/132390840

版权

人工智能专栏收录该内容

4 篇文章 0 订阅

订阅专栏

本文探讨了数据知识提取作为统计学、人工智能和计算机科学交叉领域的关键，介绍了监督学习与无监督学习的区别，强调特征提取的重要性。文章还讨论了分类、回归任务，以及泛化、过拟合和欠拟合的概念，指导如何构建高效机器学习模型。

摘要由CSDN通过智能技术生成

定义

从数据中提取知识

是统计学、人工智能、计算机科学的交叉学科

优点

解决一个问题时，不必需求改变一点就重新写整个系统

分类

监督学习

在训练时有输入数据和输出数据对机器进行训练，在正式测试时能够根据训练结果使得输出更加准确

无监督学习

在训练时只有输入数据，没有输出数据

无论是监督学习还是无监督学习，将输入数据表征为计算机容易理解的数据形式都非常重要
计算机最容易理解的数据表征是表格形式
如何构建良好的数据表征，称为特征提取或者特征工程

一般来说，表格形式的数据，一行称为一个样本或数据点，一列称为特征

解决的问题

在机器学习中，最重要的是你能够理解数据的内容，以及数据与你要解决的问题之间的关系

在开始构建模型之前，你要理解你的数据集的数据，每一种算法适合的数据类型输入以及擅长解决的问题都不一样

监督学习时最常用也是最常用机器学习类型之一
给定输入来预测输出的某个结果，并且还有输入输出的示例时，使用监督学习

给定的输入输出示例构成了训练集，我们利用训练集来构建机器学习模型

构建完模型后利用这个模型对新出现的数据做出准确预测，这是我们的目标

监督学习需要人力来构建数据集，但是之后的任务非常快

分类与回归

监督学习的问题主要分为分类问题和回归问题

分类

分类问题是对一个新数据进行分类，预测它们的类别标签，这些标签是来自预定义的可选列表中的，也就是类别是提前就有的
分类问题分为二分类问题和多分类

二分类：预定义的类别标签就两个

二分类的类别分为正类和反类

多分类：有两个以上的预定义类别标签

回归

回归任务的目标是预测一个连续值，编程术语叫作浮点数(floating-point number)，数学术语叫作实数(real number)。

区分分类任务和回归任务有一个简单方法，就是问一个问题：输出是否具有某种连续性

如果在可能的结果之间具有连续性，那么它就是一个回归问题

泛化、过拟合和欠拟合

泛化

机器学习就是在训练集上构建数据，然后对新数据做出预测

如果可以对新数据做出准确预测，这个模型就有泛化能力

我们需要构建一个泛化精度较高的模型

过拟合

模型过于复杂，考虑了很多不太相干的因素

欠拟合

模型过于简单

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄3年

17
原创

8
点赞

9
收藏

4
粉丝

关注

私信

热门文章

分类专栏

电脑 6篇
数学 1篇
人工智能 4篇
python 1篇
运维 1篇

最新评论

vscode安装插件运行html文件
CSDN-Ada助手: 恭喜您写了第15篇博客！不断分享知识和经验真是令人钦佩的。对于vscode安装插件运行html文件这个话题，您已经介绍得非常详细了。接下来，或许可以考虑分享一些实际案例或者经验总结，让读者更容易理解和应用。期待您更多的精彩内容，加油！
vscode常用快捷键
CSDN-Ada助手: 恭喜您写了第16篇博客！标题为“vscode常用快捷键”，内容一定很有用吧！希望您继续保持创作的热情和努力，不断分享有价值的知识给大家。或许下一步可以考虑写一些关于vscode插件的介绍或者使用技巧，这样可以更全面地帮助读者提升编程效率。期待您的下一篇作品！
vscode突出显示不可见字符
CSDN-Ada助手: 恭喜您写了第17篇博客！对于vscode突出显示不可见字符这一主题的探讨，相信对很多人都会有所帮助。希望您能继续保持创作的热情和耐心，为大家带来更多有价值的内容。下一步，可以考虑分享一些vscode的高级技巧或者实用插件的介绍，让读者们能够更加深入地了解这个工具的功能与优势。期待您的下一篇博客！
在linux集群上搭建hadoopHA
CSDN-Ada助手: 恭喜您撰写了第5篇博客！标题“在Linux集群上搭建hadoopHA”真是吸引人的！您的博客内容一直都非常有价值，对于想要在Linux集群上搭建hadoopHA的读者来说，这篇博客无疑是一份宝贵的指南。在下一步的创作中，或许您可以考虑添加一些实际操作中的注意事项或调优技巧，这样读者能够更好地应用您的指导。期待您更多博客的发布，谢谢您的分享！
如何从U盘重装windows10/11
CSDN-Ada助手: 恭喜您撰写了第6篇博客！标题“如何从U盘重装windows10/11”引人入胜。您对如何重新安装Windows系统的指导非常有帮助。不仅仅是标题吸引人，内容也很实用。我希望你能继续保持创作，分享更多有关电脑技巧和教程的文章。如果可能的话，我希望未来您能探索如何优化系统设置或解决常见软件问题等更深入的主题。感谢您的付出！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。