记录——Python数据处理
今天被一朋友问到一个关于python数据处理的作业,虽说我学的是Java,python只是略懂一二,就想着试试看,开始查文档–>尝试–>查文档…
这一弄就是一晚上,先给大家看看作业题目:
利用Python代码自动提取近一年(12个月)的股票价格数据,
进而抽取每家公司股票的月平均收盘价,并绘制折线图。
最后一个折线图比较简单,随便查就有,所以我就没帮她一块做了
import tushare as ts
import pandas as pd
#使用tushare获取相关的数据集
#‘300178’ 是股票代码
# start和end是数据的时间段
data = ts.get_hist_data('300178',start='2019-04-01',end='2020-03-31')
print(data)
#将数据转化为DataFrame,好进行后面的操作 这里只需要收盘价(close)
df = pd.DataFrame(data,columns=['close'])
#去掉df数据的索引,默认索引是日期,不易操作
df=df.reset_index()
#将date列的数据转为datetime format是格式
df['date']=pd.to_datetime(df['date'],format='%Y-%m-%d')
#输出df数据的类型
print(df.dtypes)
#关键一步,将df先按年分组,再按月分组,并求出各个分组的平均值
print(df.groupby([df['date'].dt.year,df['date'].dt.month]).mean())
以下是运行结果:
小人不才,对于python也是最近才开始渐渐接触的,此贴只做记录和共享之用,如有错误以及其他见解,可发私信给我互相讨论!!