优化算法 | 使用Knn算法进行数据预测流程分析

最新推荐文章于 2024-05-22 11:35:45 发布

BoomHusky

最新推荐文章于 2024-05-22 11:35:45 发布

阅读量2.3k

点赞数

分类专栏：优化算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012737193/article/details/79964796

版权

优化算法专栏收录该内容

5 篇文章 0 订阅

订阅专栏

现在给你一组数据{ a 1 ,a 2, ⋯ ,a n}，比如这组数据表示的是第1个月到第n个月的电量使用情况

现在让你根据这组数据使用KNN算法去预测a n+1的值，也就是第n+1个月的电量使用情况

由于任何一个月的用电量总是和前几个月的用电量关

系最密切 , 所以 , 用长度为 m 的向量 β 0 = { a n - m +1 , a n - m +2 ,

⋯ , a n - 1 , a n} 来预测 a n +1，由于 a n +1 未知 , 先找出 β 0 =

{ a n - m +1 , a n - m +2 , ⋯ , a n - 1 , a n } 的 K 个最近邻

在 { a 1 , a 2 , ⋯ , a n } 中 , 以 β 0 = { a n - m +1 , a n - m +2 , ⋯ , a n - 1 ,

a n } 为基 , 移动时间窗口 , 依次取 n - m 个长度为 m 的子列 :

β1 = { a n - m , an - m +1 , ⋯ , a n - 1 }, β 2 = { a n - m - 1 , a n - m , ⋯ , a n - 2 },

⋯ , β n - m - 1 ={ a 2 , a 3 , ⋯ , a m +1 }, β n - m = { a 1 , a 2 , ⋯ , a m }, 在这

些子列中找出 β0 = { a n - m +1 , a n - m +2 , ⋯ , a n - 1 , a n } 的

K 个最

近邻 , 用两向量夹角的余弦来描述两个向量的临近程度 , 即

cos ( β , β i) =

其中β ij 表示向量βi 的第j 个分量 . 那么 , 余弦值越大 , 两向

量越接近 . 通过计算 , 我们在

β 1 , β 2 ,⋯β n - m 中找出了 β 0 =

{ a n - m +1 , a n - m +2 , ⋯ , a n - 1 , a n } 的 K 个最近邻 , 记为 α 1 , α 2 ,

⋯ , α k . 因为是用 { a n - m +1 , a n - m +2 , ⋯ , a n - 1 , a n } 来预测 a n +1 ,

所以这 k 个向量最后一个分量的后紧邻的一个元素被认为

是 a n +1 的一个最近邻

取 a m +1 作为 a n +1 的一个最近邻 ( 令 b 1 = a m +1 ) 这样得到了

a n +1 的 K 个最近邻 b 1 , b 2 , ⋯ , b k , 然后对这 K 个数加权平均

计算即可算出 a n +1 ,

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
2
评论
优化算法 | 使用Knn算法进行数据预测流程分析

现在给你一组数据{ a 1 ,a 2, ⋯ ,a n}，比如这组数据表示的是第1个月到第n个月的电量使用情况现在让你根据这组数据使用KNN算法去预测a n+1的值，也就是第n+1个月的电量使用情况由于任何一个月的用电量总是和前几个月的用电量关系最密切 , 所以 , 用长度为 m 的向量 β 0 = { a n - m +1 , a n - m +2 ,⋯ , a n - 1 , a n} 来预测 ...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。