机器学习三之线性回归(Python实战)

本文在贪心学院机器学习课程代码的基础上加工而成。
本次实战的目的是利用上市公司的历史股票数据来预测其之后的5天的股票数据。
线性回归的基本原理详见《机器学习总结三之线性回归》

导入需要用的工具库

import numpy as np # 数学计算
import pandas as pd # 数据处理, 读取 CSV 文件 (e.g. pd.read_csv)
import matplotlib.pyplot as plt #绘图
from datetime import datetime as dt #处理日期类型的数据

读取数据

df = pd.read_csv('data/000001.csv')
#上市公司的股票数据可以通过tushare库获取,获取方式如下,000001为平安银行
#import tushare as ts
#df = ts.get_hist_data('000001')
#print(df)
#df.to_csv('000001.csv')

大致看下数据的构成

print(np.shape(df))
df.head()

在这里插入图片描述

df['date'] = pd.to_datetime(df['date'])# 将每一个数据的键值的类型从字符串转为日期类型
df = df.set_index('date')#将日期类型作为指示标
df.sort_values(by=['date'], inplace=True, ascending=True)# 按照时间升序排列
df.tail()#查看尾部的5个数据
df.dropna(axis=0 , inplace=True)#去除数据内部的非数值
df.isna().sum()#显示每一列的非数值的个数
Min_date = df.index.min()#最早的日期
Max_date = df.index.max()#最晚的日期
print ("First date is",Min_date)
print ("Last date is",Max_date)
print (Max_date - Min_date)#
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值