优化算法 | 使用Knn算法进行数据预测流程分析

原创 2018年04月16日 19:05:32

现在给你一组数据{ a 1 ,a 2, ⋯ ,a n},比如这组数据表示的是第1个月到第n个月的电量使用情况

现在让你根据这组数据使用KNN算法去预测a n+1的值,也就是第n+1个月的电量使用情况

由于任何一个月的用电量总是和前几个月的用电量关

系最密切 , 所以 , 用长度为 m 的向量 β 0 = { a n - m +1 , a n - m +2 ,

⋯ , a n - 1 , a n} 来预测 a n +1,由于 a n +1 未知 , 先找出 β 0 =

{ a n - m +1 , a n - m +2 , ⋯ , a n - 1 , a n } 的 K 个最近邻

在 { a 1 , a 2 , ⋯ , a n } 中 , 以 β 0 = { a n - m +1 , a n - m +2 , ⋯ , a n - 1 ,

a n } 为基 , 移动时间窗口 , 依次取 n - m 个长度为 m 的子列 :

β1 = { a n - m , an - m +1 , ⋯ , a n - 1 }, β 2 = { a n - m - 1 , a n - m , ⋯ , a n - 2 },

⋯ , β n - m - 1 ={ a 2 , a 3 , ⋯ , a m +1 }, β n - m = { a 1 , a 2 , ⋯ , a m }, 在这

些子列中找出 β0 = { a n - m +1 , a n - m +2 , ⋯ , a n - 1 , a n } 的

K 个最

近邻 , 用两向量夹角的余弦来描述两个向量的临近程度 , 即

cos ( β , β i) =

 

 

其中β ij 表示向量βi 的第j 个分量 . 那么 , 余弦值越大 , 两向

量越接近 . 通过计算 , 我们在

 β 1 , β 2 ,⋯β n - m 中找出了 β 0 =

{ a n - m +1 , a n - m +2 , ⋯ , a n - 1 , a n } 的 K 个最近邻 , 记为 α 1 , α 2 ,

⋯ , α k . 因为是用 { a n - m +1 , a n - m +2 , ⋯ , a n - 1 , a n } 来预测 a n +1 ,

所以这 k 个向量最后一个分量的后紧邻的一个元素被认为

是 a n +1 的一个最近邻

取 a m +1 作为 a n +1 的一个最近邻 ( 令 b 1 = a m +1 ) 这样得到了

a n +1 的 K 个最近邻 b 1 , b 2 , ⋯ , b k , 然后对这 K 个数加权平均

计算即可算出 a n +1 ,

使用线性回归进行连续型分布预测实战

Python 在机器学习领域应用是非常广泛的,比如,我们可以使用机器学习进行验证码识别,使用机器学习实现计算机视觉项目,或者,我们也可以使用机器学习技术实现网页分类、文本挖掘、情感分析等等各种各样的事情。机器学习的重点在于算法,而算法的学习相对来说是比较枯燥的,所以,只有在学习的时候让算法跟实例结合,才能够让算法的学习变得不枯燥,并且也才能够更好的将理论运用与实践。
  • 2017年05月05日 16:03

程序优化

一、 序言 程序优化是指利用软件开发工具对程序进行调整和改进,让程序充分利用资源,提高运行效率,缩减代码尺寸的过程。按照优化的侧重点不同,程序优化可分为运行速度优化和代码尺寸优化。 运行速...
  • u010651072
  • u010651072
  • 2016-01-17 18:29:48
  • 3552

十大步骤帮你有效使用预测分析算法

一个成功的预测分析项目不仅仅涉及软件部署,使用软件分析数据。了解下面这些步骤可以帮助你为分析项目打下坚实基础。  越来越多的企业开始使用预测分析算法。描述性分析一般提供一种视角,让你了解已经发生了什么...
  • bingdata123
  • bingdata123
  • 2018-04-09 09:38:03
  • 27

机器学习十大经典算法—KNN(最近邻)

机器学习十大经典算法—KNN(最近邻) K-近邻算法原理K最近邻(kNN,k-NearestNeighbor)分类算法,见名思意:找到最近的k个邻居(样本),在前k个样本中选择频率最高的类别作为预测类...
  • Michael__Corleone
  • Michael__Corleone
  • 2017-05-26 21:29:28
  • 3661

k最近邻算法(kNN)

kNN算法的描述和kd树
  • liqiutuoyuan
  • liqiutuoyuan
  • 2017-08-10 21:15:21
  • 2251

足球预测算法分析之埃罗预测

作为爆盘侠足球预测应用的开发者之一,在长时间研究架构爆盘侠的过程中,对于各种主流的足球赛事预测算法小有心得,今天决定分享出来,以我们的爆盘侠网站为样本,网址参见:http://www.baopanxi...
  • heiningl52615
  • heiningl52615
  • 2016-03-03 22:26:25
  • 2584

【推荐系统算法】PMF(Probabilistic Matrix Factorization)

细读论文:现代推荐系统的基础算法之一PMF。
  • shenxiaolu1984
  • shenxiaolu1984
  • 2016-01-27 15:02:12
  • 16821

区域内的人数预测算法对比实验分析

一般人的活动具有规律性,其中一个体现就是区域的人数变化规律,通过分析区域的历史人数,预测下一个时间的人数...
  • ifromearth
  • ifromearth
  • 2017-04-19 15:04:11
  • 986

编译原理实验之<em>预测</em>分析<em>算法</em>的设计与实现

编译原理 语法分析 <em>预测</em>分析法(含代码) 时间:2018-4-16 编译原理<em>预测</em>分析法语法分析程序 时间:2018-4-17 <em>预测</em>分析表构造<em>算法</em>的程序实现 时间:2018-4-17 ...
  • 2018年04月22日 00:00

预测分析法

一、实验项目名称 实验二、预测分析法 二、实验目的 根据某一LL(1)文法编制调试预测分析程序,以便对任意输入的符号串进行分析。本次实验的目的主要是加深对预测分析法的理解。 三、实验环境 Cfree5...
  • fred1653
  • fred1653
  • 2013-07-16 11:58:18
  • 3847
收藏助手
不良信息举报
您举报文章:优化算法 | 使用Knn算法进行数据预测流程分析
举报原因:
原因补充:

(最多只允许输入30个字)