Tushare ID :475226
我国金融市场在改革开放之后取得了瞩目的成绩,并且随着信息技术的发展、金融市场的发展,金融机构都累积了非常庞大的数据量,包括了海量的交易内容和资讯消息数据等,从业者们希望能够将这些数据充分挖掘,以解决更多的问题、发现更多的机遇。2012年Google正式提出了知识图谱的概念,它是一种揭示实体之间关系的语义网络,通过建立实体之间的关系形成图谱网络,通过对知识图谱的挖掘,能够发现很多数据中隐含表达的内容。
知识图谱的构建往往需要将结构化的数据和非结构化的数据进行整合、加入。
结构化数据的输入往往比较简单,我们可以先试着将一部分结构化数据输入到Neo4J(图数据库)中,形成最构建金融领域知识图谱中最基础的部分。
图:根据行业进行分类的图谱展示
首先我们可以通过tushare获取这些基础数据
现在tushare里面选取需要的内容,可以直接点击生成代码获取对应的代码,直接存对应的dataframe即可。
图:tushare数据获取界面,很方便
这里我们把数据都存为csv格式的