笔者ID:476408
对金融行业的研究,常用的方法是财务分析。企业的财务状况很好的反映了公司的经营情况,运营能力,偿债能力以及企业现金流等诸多问题。因此,利用Tushare进行的财务数据的选取具有非常大的优势。
以下就是我在日常学习中常用的对股票进行分类的方法-主成分和K-means均值聚类。
初学级别,代码还有很多改进的地方。
代码如下:
# 获取沪深300成分股财务数据信息
# 选择财务指标,2种指标
import tushare as ts
import pandas as pd
import numpy as np
import time
token=''
ts.set_token(token)
pro = ts.pro_api(token)
df=pro.index_weight(index_code='399300.SZ',trade_date='20211101') # 获取沪深300指数成分和权重
df.to_excel('沪深300成分.xlsx') # 导入EXCEL表
df1=df.iloc[:,1] # 截取成分股的代码
df1=list(df1) # 转化为列表数据
all_dataframe=pd.DataFrame() # 创建数据框
for wl in df1: # 利用循环,获取沪深300对应的个股名称、行业、市场信息
shuju=pro.stock_basic(ts_code=wl,list_status='L')
all_dataframe=all_dataframe.append(shuju) # 逐个添加到数据框
time.sleep(1) # 权限问题,运行时间较长。如果权限足够,可以删除
all_d