数据分析13——Pandas数据导出/日期数据处理/样本采样

Pandas数据导出

1、导出Excel:

  • 举例:
    • 代码:df.to_excel(‘./data/text_01.xlsx’, sheet_name=‘订单明细’, index=False)
    • 解释:将df数据导入到相对路径为’./data/text_01.xlsx’的文件中,其中数据表名称为’订单明细’,去除之前的索引

2、导出CSV:

  • 举例:
    • 代码:df.to_csv(‘export_02.csv’, encoding=‘utf_8_sig’, index=False)
    • 解释:类似上面的导出excel

3、导出Txt:

  • 举例:
    • 代码:df.to_csv(‘export_03.txt’, sep=‘\t’, encoding=‘utf_8_sig’, index=False)
    • 解释:类似上面的导出excel,sep='\t’表示用制表符分隔数据,encoding='utf_8_sig’表示编码格式

4、导出Json:

  • 举例:
    • 代码:df.to_json(‘export_04.json’, orient=‘split’, force_ascii=False)
    • 解释:类似上面的导出excel,orient是json中存放数据的形式有很多{‘split’, ‘records’, ‘index’, ‘columns’, ‘values’, ‘table’},force_ascii设置为False,则force_ascii编码就会失效,否则默认force_ascii编码的话,中文就会被加密,显示不出来。

4、导出到数据库:

  • 说明:本质就是模拟了一个sql添加表的过程
  • 注意:要导入到数据库中要保证有对应的两个python库,没有的话在对应环境中执行下面语句装一下:
    • pip install sqlalchemy
    • pip install pymysql
  • 举例:
    在这里插入图片描述


日期数据处理

1、日期解析

  • 日期解析举例:
    在这里插入图片描述

  • 日期组合举例:
    在这里插入图片描述

  • 提取日期举例:注意dt表示时间类型,类似于字符串的str,在dt中集合了时间处理的相关方法
    在这里插入图片描述

  • 日期切片:
    在这里插入图片描述

  • 重采样举例:

    • 说明:重采样相当于按照日期分组聚合,重采样的前提是把日期对应的列先设为索引
    • 按年统计:
      在这里插入图片描述
    • 按季度统计:
      在这里插入图片描述
    • 按月统计:
      在这里插入图片描述
  • OHLC函数:一般股市用的比较多
    在这里插入图片描述



样本采样

1、sample函数

tb = pd.DataFrame(
    data=[['貂蝉', 4],
          ['西施', 3],
          ['王昭君', 2],
          ['杨玉环', 1]],
    columns=['贵妃', '权重'])
# n:抽样数量
# frac:抽样比例,如果设置抽样比例就不用设置n,抽样比例为0.5,表示从所有样本中抽出1/2
# replace:是否重复抽样,默认否
# weights:抽样权重,选取数据中某一列作为抽样权重,权重大的抽样概率高
# random_state:随机种子
# axis:指定轴,一半不设定,就按照默认的抽行数据

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值