Python 实现数据科学中的无监督挖掘技术

最新推荐文章于 2023-12-29 01:45:22 发布

Deng872347348

最新推荐文章于 2023-12-29 01:45:22 发布

阅读量1.4k

点赞数

分类专栏：机器学习数据挖掘文章标签： python 机器学习聚类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Deng872347348/article/details/121289777

版权

机器学习同时被 2 个专栏收录

51 篇文章 12 订阅 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

9 篇文章 0 订阅

订阅专栏

Python 实现数据科学中的无监督挖掘技术

文章目录

- Python 实现数据科学中的无监督挖掘技术

依赖 Python 的 NumPy、 SciPy、 matplotlib 和 scikit-learn 等库

我们会了解到几种距离度量开始，了解不同的距离度量和空间对于构建数据科学应用是非常关键的。任何数据集都是一系列的点，这些点都属于某个特定空间。我们可以把空间定义为一个普遍的点的集合，数据集里的点就落在这个集合中。最常用的空间是欧几里德空间，在欧氏空间里，点是实数向量，向量的长度就是它的维度数。

核方法，它是机器学习中非常重要的一个主题，帮助我们使用线性方法解决非线性数据问题。我们主要介绍核映射的概念。

对一些聚类算法的讲解，聚类是将一系列点分隔到不同的逻辑组里的处理过程。例如一个超市的场景，商品被定性地按种类进行分组，而我们要研究的是如何进行定量处理。

学习向量量化，它是一种无监督技术

使用距离度量

很多数据挖掘任务，计算距离和相似度度量非常关键。本节将研究一些距离度量的实践，下一节则讨论相似度度量。在研究距离度量之前，我们先定义一下距离测度。

作为数据科学家，我们经常接触不同维度的点或向量。在数学层面上，一系列的点定义了一个空间，一个空间里的距离度量被定义为函数 d(x,y) ，它把空间里的 x 和 y 两个点作为参数，返回一个实数作为输出，这个距离函数输出的实数，要满足以下几点规则。

距离函数的输出必须是非负的，d(x,y)≥0。
仅当 x

了解本专栏

超级会员免费看

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Python 实现数据科学中的无监督挖掘技术

Python 实现数据科学中的无监督挖掘技术文章目录Python 实现数据科学中的无监督挖掘技术使用距离度量准备工作工作原理更多内容学习和使用核方法准备工作操作方法工作原理更多内容完整代码：用 k-means 进行数据聚类准备工作操作方法2.2.3 工作原理更多内容完整代码：学习向量量化准备工作操作方法工作原理更多内容完整代码准备工作操作方法工作原理更多内容完整代码：使用局部异常因子方法发现异常点准备工作操作方法工作原理完整代码：依赖 Python 的 NumPy、SciPy、matplotlib 和
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Deng872347348 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。