在这篇学习日志中,我们将学习如何使用Tushare库获取美股行情数据,并进行简单的数据分析。
第一部分:初始化与数据获取
首先,我们需要初始化Tushare API,并使用us_daily
接口获取美股行情数据。
import tushare as ts
import pandas as pd
import matplotlib.pyplot as plt
# 初始化Tushare API
pro = ts.pro_api()
# 获取美股行情数据(以苹果公司AAPL为例)从2019年1月1日到2019年9月4日
df = pro.us_daily(ts_code='AAPL', start_date='20190101', end_date='20190904')
第二部分:数据概览
让我们先来看一下获取到的美股行情数据的一些基本信息。
# 打印数据前几行
print(df.head())
数据样例:
ts_code trade_date close open high low pre_close pct_change vol amount vwap
0 AAPL 20190904 209.19 208.39 209.48 207.32 205.70 1.70 19216821 4008342529.970000 208.59
1 AAPL 20190903 205.70 206.43 206.98 204.22 208.74 -1.46 20059575 4120106317.760000 205.39
2 AAPL 20190830 208.74 210.16 210.45 207.20 209.01 -0.13 21162563 4410472824.780000 208.41
3 AAPL 20190829 209.01 208.50 209.32 206.66 205.53 1.69 21007653 4380322743.230000 208.51
4 AAPL 20190828 205.53 204.10 205.72 203.32 204.16 0.67 15957633 3269889907.950000 204.91
第三部分:数据分析
3.1 收益率曲线趋势分析
让我们通过折线图来分析美股(以苹果公司AAPL为例)的收益率曲线趋势。
# 将日期转换为日期格式
df['trade_date'] = pd.to_datetime(df['trade_date'], format='%Y%m%d')
# 绘制收益率曲线趋势图
plt.figure(figsize=(12, 6))
plt.plot(df['trade_date'], df['close'], label='收盘价')
plt.plot(df['trade_date'], df['open'], label='开盘价')
plt.plot(df['trade_date'], df['high'], label='最高价')
plt.plot(df['trade_date'], df['low'], label='最低价')
plt.title('美股行情收益率曲线趋势分析(AAPL)')
plt.xlabel('日期')
plt.ylabel('价格')
plt.legend()
plt.grid(True)
plt.show()
3.2 成交量分析
我们也可以分析成交量的变化。
# 绘制成交量柱状图
plt.figure(figsize=(12, 6))
plt.bar(df['trade_date'], df['vol'], color='blue', label='成交量')
plt.title('美股行情成交量分析(AAPL)')
plt.xlabel('日期')
plt.ylabel('成交量')
plt.legend()
plt.grid(True)
plt.show()
第四部分:总结
通过以上分析,我们可以清晰地看到苹果公司(AAPL)在2019年1月1日到2019年9月4日的收益率曲线趋势以及成交量的变化情况。