基于多元线性回归的股票分析与预测——R语言

本文利用R语言对贵州茅台股票数据进行多元线性回归分析,通过模型建立、优化和误差率计算,发现模型能有效预测股票开盘价,平均误差率约为0.08。
摘要由CSDN通过智能技术生成

一、数据来源

本文选取2016年12月至2021年12月共计5年贵州茅台股票的行情数据及后一天的开盘价格数据,对其进行实验研究。所有数据均来源于巨潮资讯网。

1.自变量

股票价格往往受到多个因素的影响,因此,需要建立包含多个变量的预测模型。对于模型的自变量,本文选取贵州茅台公布的行情数据中的最高价、最低价、收盘价、成交数、成交金额等行情指标, 以衡量该公司的股票行情。

2.因变量

由于股票价格包括开盘价、收盘价、最高价、最低价等价格,为了简化模型,本文选取贵州茅台公布行情是的后一天的开盘价格作为因变量。

二、多元线性回归

1. 初步建立多元线性回归模型

(1)数据集划分

将股票的历史数据通过csv文件输入 RStudio软件中,运用RStudio将贵州茅台5年来1200多条数据分为train.data(训练集), test.data(测试集)两个数据集,每个数据集包含了600条数据集。其次将开盘价设为y,最高价设为x1,最低价设为x2,收盘价设为x3,成交量设为x4,成交金额设为x5。

### 从CSV文件中读取股票数据
data <- read.csv("600519 .csv", encoding = "UTF-8",sep = ",")
data<- data[3:8]
data
### 更改列名为"code", "date", "y", "x1", "x2", "x3", "x4", "x5"
colnames(data)
colnames(data)<-c("y", "x1", "x2", 
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值