数据挖掘中的机器学习

最新推荐文章于 2024-05-16 09:14:26 发布

嘻哈带古风

最新推荐文章于 2024-05-16 09:14:26 发布

阅读量613

点赞数

文章标签：机器学习数据挖掘聚类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_68745178/article/details/127465152

版权

本文从基本概念出发，探讨机器学习和数据挖掘的关系与异同，通过四个示例（关联问题、分类问题、聚类问题、回归问题）揭示它们在实际中的应用。机器学习关注计算机如何通过经验改善性能，涉及监督学习、非监督学习、半监督学习和强化学习等多种学习方式。

摘要由CSDN通过智能技术生成

引言
在大多数非计算机专业人士以及部分计算机专业背景人士眼中，机器学习(Data Mining)以及数据挖掘(Machine Learning)是两个高深的领域。在笔者看来，这是一种过高”瞻仰“的习惯性错误理解（在这里我加了好多定语）。事实上，这两个领域与计算机其他领域一样都是在融汇理论和实践的过程中不断熟练和深入，不同之处仅在于渗透了更多的数学知识（主要是统计学），在后面的文章中我会努力将这些数学知识以一种更容易理解的方式讲解给大家。本文从基本概念出发浅析他们的关系和异同，不讲具体算法和数学公式。希望对大家能有所帮助。

示例1（关联问题）：
经常去超市的同学可能会发现，我们事先在购物清单上列举好的某些商品可能会被超市阿姨摆放在相邻的区域。例如，面包柜台旁边会摆上黄油、面条柜台附近一定会有老干妈等等。这样的物品摆放会让我们的购物过程更加快捷、轻松。

那么如何知道哪些物品该摆放在一块？又或者用户在购买某一个商品的情况下购买另一个商品的概率有多大？这就要利用关联数据挖掘的相关算法来解决。

示例2（分类问题）：
在嘈杂的广场上，身边人来人往。仔细观察他们的外貌、衣着、言行等我们会不自觉地断论这个人是新疆人、东北人或者是上海人。又例如，在刚刚结束的2015NBA总决赛中，各类权威机构会大量分析骑士队与勇士队的历史数据从而得出骑士队或者勇士队是否会夺冠的结论。

在上述第一个例子中，由于地域众多，在对人进行地域分类的时候这是一个典型的多分类问题。而在第二个例子中各类机构预测勇士队是否会战胜骑士队夺冠，这是一个二分类问题，其结果只有两种。二分类问题在业界的出镜率异常高，例如在推荐系统中预测一个人是否会买某个商品、其他诸

最低0.47元/天解锁文章

嘻哈带古风

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
数据挖掘中的机器学习

通常，假设我们的目标是一个function f，我们会给计算机提供一定的训练数据让其进行学习训练，每一次的学习会训练出一个hypothesis h，当h和f随着计算机不断学习越来越接近时，就说h越来越达到满意程度。在建立预测模型的时候，监督式学习建立一个学习过程，将预测结果与“训练数据”的实际结果进行比较，不断的调整预测模型，直到模型的预测结果达到一个预期的准确率。将算法按照学习方式分类是一个不错的想法，这样可以让人们在建模和算法选择的时候考虑能根据输入数据来选择最合适的算法来获得最好的结果。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。