手动实现多分类adaboost算法_如何使用R语言手动实现机器学习KNN算法拟合——以得克萨斯州电力需求数据为例...

机器学习 (Machine Learning) 是目前备受追捧的学习领域之一,无论是学界还是业界都痴迷于机器学习的研究,甚至很多读BA的毕业生认为工作不用机器学习就会显得水平很低587ec519b3d48f700bbabf20a09ac4a8.png587ec519b3d48f700bbabf20a09ac4a8.png587ec519b3d48f700bbabf20a09ac4a8.png今天的学习记录就复习一下机器学习领域最最简单的一个算法——K-Nearest Neighbourhood Algorithm,中文名称应该是叫KNN算法。

今天的学习记录只是复盘一下我在春季学期数据挖掘课程中学到的KNN算法的入门案例,R本身可以使用FNN包自动运行KNN算法,但是今天我会手动计算拟合值。另外,进行数据分析时,一般按照80%/20%的比例将数据随机分成training data和test data,这里的演示没有做此区分。如果想细致深入了解KNN算法,推荐阅读USC教授Gareth James的An Introduction to Statistical Learning

入门案例是根据根据温度预测得克萨斯州用电量,数据"loadhou.csv"包含三个变量:时间 (Time)、用电量 (COAST)、温度 (KHOU)。

062393a28caf1a310eb679d41f4ec26d.png

数据包含了2010-2016年度每天下午三点所测得的休斯顿机场温度以及得克萨斯州地区的用电总量。根据常识,当温度越低或者越高时,用电需求都会增大,所以二者的关系可视化之后应该呈现为开口向上的抛物线。如下图:

library(tidyverse)library(gganimate)### 导入数据 推荐使用RStudio
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值