从雅虎财经上下载6家公司股票信息,并进行分析。
1. 获取数据
pandas_datareader.data.DataReader支持包括雅虎、谷歌在内的十数种数据来源,本篇笔记只关注来源为雅虎财经的数据。
注意:直接使用pandas_datareader.data.get_data_yahoo会出现ImmediateDeprecationError,原因是Yahoo! Finance已经不存在了,2017年Yahoo!被Verizon收购了,因此,需在终端pip install fix-yahoo-finance补丁,专门解决pandas_datareader无法yahoo金融数据的方法。
import pandas as pd
# 导入互联网数据获取包pandas_datareader,使用前需先安装pip install pandas-datareader
import pandas_datareader.data as web
# 导入补丁包fix_yahoo_finance
import fix_yahoo_finance as yf
yf.pdr_override()
获取美股直接填写股票代码即可;
获取国内股票数据的方式是:“股票代码”+“对应股市”(港股为.hk,A股为.ss),例如腾讯是港股是:0700.hk
#字典:6家公司的股票
gafataDict={'谷歌':'GOOG','亚马逊':'AMZN','Facebook':'FB',
'苹果':'AAPL','阿里巴巴':'BABA','腾讯':'0700.hk'}
# 导入日期
import datetime
# 获取哪段时间范围的股票数据
start_date=datetime.datetime(2017,1,1)
end_date=datetime.datetime(2018,1,1)
#从雅虎财经数据源(get_data_yahoo)获取阿里巴巴股票数据
babaDf=web.get_data_yahoo(gafataDict['阿里巴巴'],start_date, end_date)
2. 观察数据
'''
每日股票价位信息
Open:开盘价
High:最高加
Low:最低价
Close:收盘价
下面我们主要关注每日的收盘价
'''
# 数据集表格头
babaDf.head()
# 数据类型
babaDf.dtypes
# 统计汇总
babaDf.describe()
# 数据集信息
babaDf.info()