K-近邻算法与线性回归

(一)K-近邻算法
1.示例引入

在这里插入图片描述

2.概念与计算公式

K最近邻(k-Nearest Neighbor,KNN)分类算法,为给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例(也就是上面所说的K个邻居), 这K个实例的多数属于某个类,就把该输入实例分类到这个类中。

具体点击这里

3.k值的选择

在这里插入图片描述

4.K-近邻算法的缺点与改进

计算量较大,因为对每一个待分类的文本都要计算它到全体已知样本的距离,才能求得它的K个最近邻点。目前常用的解决方法是事先对已知样本点进行剪辑,事先去除对分类作用不大的样本。该算法比较适用于样本容量比较大的类域的自动分类,而那些样本容量较小的类域采用这种算法比较容易产生误分。

5.K-近邻算法的代码实现

详情请参考这位博主:在这里
使用kd树进行改进: kd树本质是一个二叉树。
kd树的构建:
在这里插入图片描述
选择方差较大的维度作为根节点的选择维度。如上例题,x的方差为9-2,y的方差为7-2,所以选择x作为根节点。之后,根据y轴进行划分。
在这里插入图片描述

补充:

(二)切比雪夫问题
(三)曼哈顿问题
(四)闵可夫斯基距离
(五)欧式距离
(六)线性回归

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
股价数据预测是金融领域的一个重要应用。下面是对你提到的几种机器学习算法在股价数据预测中的应用: 1. 线性回归线性回归是一种基本的统计学习方法,它可以用来建立股价与其他变量之间的线性关系模型。通过收集多个因素对股价的影响,例如市场指数、财务指标等,利用线性回归可以建立一个预测模型,从而预测股价的变化趋势。 2. k-近邻:k-近邻是一种基于样本距离的分类与回归方法,它可以通过寻找与目标样本最近的k个邻居,来预测目标样本的值。在股价预测中,可以利用历史股价数据作为训练样本,通过寻找与目标日期最近的历史数据,来预测未来的股价变化。 3. 决策树:决策树是一种基于树形结构的分类与回归方法,它通过将样本分割成不同的子集,从而建立一个分类或回归模型。在股价预测中,可以利用历史股价数据和其他因素作为训练样本,通过建立决策树模型来预测未来的股价变化。 4. 随机森林:随机森林是一种基于多个决策树的集成学习方法,它通过随机选择特征和样本来建立多个决策树,从而提高模型的泛化性能。在股价预测中,可以利用历史股价数据和其他因素作为训练样本,通过建立随机森林模型来预测未来的股价变化。 5. 支持向量机:支持向量机是一种基于最大间隔分类的分类与回归方法,它通过寻找一个最优的超平面来将样本分割成不同的类别。在股价预测中,可以利用历史股价数据和其他因素作为训练样本,通过建立支持向量机模型来预测未来的股价变化。 6. LSTM:LSTM是一种特殊的循环神经网络,它通过引入门控机制来解决长期依赖问题,从而适用于序列数据的建模。在股价预测中,可以利用历史股价数据作为训练样本,通过建立LSTM模型来预测未来的股价变化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值