上一篇文章(信用债+python入门碎念和小试牛刀)已经读出了所有的债券样本,并把文件保存在了“wind_code/”,所以本节从读取里面的某一个csv开始:一般公司债未到期2019-08-09.csv,这个现在都还存续着,计算方便。
首先是引用的库开始,以下依次分别:
1. wind的量化接口,
2. pandas(主要使用dataframe的数据结构进行操作),
3. numpy(主要是数学运算),
4. matplotlib(画图)
from WindPy import wimport pandas as pdimport numpy as npimport matplotlib.pyplot as plt
一定要输入这个来启动wind
w.start()
读取上一轮保存好的文件,并把其中的wind_code这一列债券代码读出来,用tolist()转换成list格式
f = open('wind_code/一般公司债未到期2019-08-09.csv', encoding="utf_8_sig")data = pd.read_csv(f, index_col=0)CodeList = data["wind_code"].tolist()print(CodeList) #打印看一下
读取债券要素(截面数据,票息、全称、条款、行业分类...英文写的很清楚)
# 注意长字符串书写规则,一行不要太长bond_property = 'fullname,' \ 'comp_name,' \ 'clause,' \ 'carrydate,' \ 'maturitydate,' \ 'prepaymentdate,' \ 'industry_sw,' \ 'issueamount,' \ 'couponrate'# 要素的参数,比如industryType=1是industry_sw一级行业的意思options = 'industryType=1;serial=1&#