最近股市比较火。我们就利用这篇文章简单介绍下用 python 对股票数据做个简单的分析。数据集是从1999年到2016年上海证券交易所的1095只股票。
共1000个文件。
我们的分析思路大致如下:
每年新发股票数
目前市值最大的公司有哪些
股票一段时间的涨跌幅如何
牛市的时候,个股表现如何
首先导入模块
import pandas as pd
import numpy as np
import os
import seaborn as sns
import matplotlib.pyplot as plt
# 绘图显示中文
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
用 pandas 读文件
file_list = os.listdir('./data/a-share/')
pieces = []
for file_name in file_list:
path = './data/a-share/%s' % file_name
file = pd.read_csv(path, encoding ='gb2312')
pieces.append(file)
shares = pd.concat(pieces)
使用 read_csv 读文件的时候需要指定文件编码 encoding =‘gb2312’ 。将各个文件的 DataFrame 合并后,将索引重置一下,并预览一下数据
shares.reset_index(inplace=True, drop=True)
shares.head()