数据分析——关于数据的加载、存储和文件的格式

关于数据的加载、存储和文件的格式

主要使用pandas

文本格式数据的读写

将表格性数据读取为pandas中的DataFrame对象。其中的read_csvread_table用的最多。

pandas常见的解析函数:
在这里插入图片描述

这些函数将文本数据转换为pandas便于pandas处理的DataFrame对象,这些函数的可选参数主要有以下几种:

索引:

  • 可以将一个或多个列作为返回的DataFrame,从文件或用户获取列名,也可以没有列名

类型推断和数据转换:

  • 包括用户自定义的值转换和自定义的缺失值符号列表

日期时间解析:

  • 包括组合功能,也包括将分散在多个列上的日期和时间信息组合成结果中的单个列

迭代:

  • 支持对大型文件的分块迭代

未清洗的数据问题:

  • 跳过行、页脚、注释以及其他次要数据,比如使用逗号分隔千位的数字
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值