DolphinDB使用案例1:将文本文件导入数据库

本文系对官方教程的复现,记录从新手的角度在实现目标道路上遇到的问题。

  • 获取USstocks.csv

    采用芝加哥大学的证券价格研究中心(CRSP)给出的1990-2016年上千只美股的每日交易记录,官网并不对外开放账号注册、DolphinDB也没有对外开放,网上我也没有找到。

    就是说,找不到原汁原味的数据,改用数字货币历史数据替代。

    我用的是火币btc_usdt_1t.csv

  • 加载csv

  • 并行加载btc_usdt_1t.csv
    btc_usdt = ploadText("D:/DolphinDB/Data/btc_usdt_1t.csv")
    
  • 非并行加载btc_usdt_1t.csv
    btc_usdt = loadText("D:/DolphinDB/Data/btc_usdt_1t.csv")
    
  • 比较两种加载方式时间

    在这里插入图片描述

  • 并行加载机制

    并行加载文件需要的内存至少是表大小的两倍。

    如果文件大小超过可用内存,可以把数据保存在分布式文件系统的分区表中

  • 数据类型

  • 确定数据的类型

    当加载外部文件时,系统会对每列随机抽样,然后推断每列的数据类型。

    采用extractTextSchema函数检查文本文件中的数据类型。

    schema = extractTextSchema("D:/DolphinDB/Data/btc_usdt_1t.csv")
    

    在这里插入图片描述

  • 更改数据类型
    # 将col0列数据类型转换为DOUBLE
    update schema set type=`DOUBLE where name=`col0
    # 以上述结构加载文件到DolphinDB
    btc_usdt= ploadText("D:/DolphinDB/Data/btc_usdt_1t.csv",,schema)
    # 查看数据
    schema = extractTextSchema("D:/DolphinDB/Data/btc_usdt_1t.csv")
    

    双击右侧schema即可查看数据结构,可以发现col0数据类型已经变为DOUBLE

    在这里插入图片描述

    同样方式,可查看已经载入的数据:

    在这里插入图片描述

  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值