统计学习导论基于R应用——笔记(第四章:Logistic Regression)
1、变量说明:
(1)解释变量
Year(2001年到2005年)
Lag1-Lag5(过去5个交易日中的每个交易日的投资回报率)
Volume(前一日股票成交量,单位为十亿)
Today(当日的投资回报率)
(2)响应变量:
Direction : “涨” / “跌”
2、相关代码:
#4.6.1 The Stock Market Data
library(ISLR)
data=Smarket #查看数据
names(data) #变量的名称
dim(data) #查看变量的维数
summary(data)
boxplot(Lag1~Direction,data=data) #箱型图
class(data) #查看整体数据类型
str(data) #查看各变量的类型
cor(data[ ,-9]) #相关系数矩阵