pandas应用(二)

import pandas as pd

处理时间序列

# 使用date_range方法生成时间序列,freq参数的常用值及含义如下
# D ---> 日
# M ---> 月
# Y ---> 年
# H ---> 小时
# W ---> 星期
# S ---> 秒
pd.date_range('24/2/2020', '25/3/2020', freq='D')

结果为:
在这里插入图片描述
生成了2020年2月24日到2020年3月25日的时间序列,间隔为1天。

类别型

# 生成6行2列的源数据
df = pd.DataFrame(data={'id':np.arange(1,7), 'grade':['a','b','b','a','e','e']})

df

结果为(id可理解为学生的编号,grade为学生的成绩)
在这里插入图片描述

# 查看每列的数据类型
df.dtypes

结果为
在这里插入图片描述
现在成绩列的数据为object类型。

# 添加一列,将成绩列的数据改为category类型
df['score'] = df['grade'].astype('category')

再次查看数据类型

df.dtypes

结果为
在这里插入图片描述
新添加的列为category类型(会自动将数据进行分类)。

# 用有含义的名字重命名不同类型的数值
df['score'].cat.categories = ['very good','good','very bad']

df

结果为
在这里插入图片描述
这里是将成绩为“a”改为“very good”,以此类推。

文件读写操作

  1. 读文件
# 读文本文件
pd.read_csv('./data.txt', index_col=0)

结果为
在这里插入图片描述

# 读Excel文件
pd.read_excel('./data.xls', index_col=0)

结果为
在这里插入图片描述

# 读json文件
pd.read_json('./data.json')

结果为
在这里插入图片描述

  1. 写文件
# 生成数据
df = pd.DataFrame(np.random.randint(0,151,size = (10000,3)),columns = ['Chinese','Math','English'])

df.head()

结果为
在这里插入图片描述

# 写入excel中
df.to_excel('./data.xls')
# 写到文本中
df.to_csv('./data.csv')
df.to_csv('./data.txt')
# 写到json
df.to_json('./data.json')
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值