python 金融知识图谱_从零搭建金融证券知识图谱-Part1

本文是Python构建金融证券知识图谱系列的第一部分,介绍了如何使用TUSHARE获取股票、上市公司、基金等数据,并构建数据模型。作者开源了相关代码,便于读者学习和复现。
摘要由CSDN通过智能技术生成

引言

前年,无意中发现 Python 中金融数据包 TUSHARE 当时就萌生想要搭建一个金融证券图谱的想法。

疫情期间隔离在家,就一鼓作气把它完成了,为避免过于冗长,打算用四篇文章将建设过程中的方法和经验整理出来。本文作为该系列的第一篇文章。数据获取和数据模型构建

数据抽取和实体对齐

图谱存储和图谱应用

图谱更新

我将全部代码用 jupyter notebook 的形式开源在我的Github上,方便感兴趣的朋友一步步复现和学习。如果觉得有帮助,那就给个star吧~https://github.com/kevin-meng/financial_stock_knowledge_graph​github.com

1. 数据获取

TUSHARE 是免费提供各类金融数据平台,提供相应的 python 数据接口,覆盖的数据也很丰富。之所以选择他,一方面,其数据较全,调取方便。另外,其对数据做过清洗,结构统一,可以节省大部分清理时间,缩短图谱搭建周期。

目前,最新的 pro 数据接口于不同的数据,有相应的积分要求。我筛选玩数据后,才发现积分不足,无奈只能打钱充值了。根据 TUSHARE 的接口文档,对数据进行筛选。选择以下6类关联数据。股票列表

上市公司基本信息

上市公司管理层

公募基金列表

公募基金公司

公募基金持仓数据

具体代码如下:

import tushare as ts</

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值