powerbi 线性回归_Power BI K近邻(KNN)分类算法的实现

最新推荐文章于 2022-09-22 21:56:22 发布

weixin_39974882

最新推荐文章于 2022-09-22 21:56:22 发布

阅读量575

点赞数

文章标签： powerbi 线性回归

本文链接：https://blog.csdn.net/weixin_39974882/article/details/111820128

版权

本文介绍了如何在Power BI中仅使用DAX实现K近邻(KNN)分类算法。作者通过实例展示了如何计算测试点与训练集数据点的距离，找出最近邻并进行多数表决分类，从而完成数据的自动分类。尽管DAX通常不用于机器学习，但这个实践证明了其在简单机器学习任务上的可行性。

摘要由CSDN通过智能技术生成

在使用Power BI的过程中，我时常会想，能不能够仅仅依靠Power BI自身来实现一些较简单的机器学习算法，而不用事事都依赖于R和Python，因此，我使用DAX做了一些尝试。过去，我实现了用DAX完成了多元线性回归，但那属于回归算法。对于分类算法，至少在K近邻算法方面，Google和百度上找不到有人做过这样的尝试，这也许因为极少有人会认为机器学习算法在DAX上能行得通，但下文的实践可以证明，这是行得通的。

一、K近邻算法简介

(此处如了解可直接跳过) KNN全称k-nearest neighbors, 意为K近邻，是一种监督机器学习算法，新的数据点会放在现有数据集中，根据它与相邻数据点的距离来判定该数据点属于哪个类别。比如说，数据集里有一百张猫的图片和一百张狗的图片，并且记录了它们身体各个部位的特点，因此，当一张新的图片进来时，比如说图片中的动物有尖尖的耳朵，那么K近邻算法会依据它与数据集某些数据的相似性而把它归类为猫。此外，在现实应用中，我们根据不同情况来决定K的取值，比如令K等于7，那么我们分析离新的数据点最近的七个点属于什么类别，如果这些点中有3个属于A类，其余的属于B类，那么算法会依据多数表决法把它归类为B类，如下图所示：(图片源自https://www.edureka.co/blog/knn-algorithm-in-r/)

二、利用DAX的实现过程

1.准备工作

下图中的彩色散点是我随机生成的产品数据，横轴代表销量，纵轴代表利润，而其中7