pandas小习题

import numpy as np
import pandas as pd
from pandas import DataFrame,Series
df_tb1=pd.read_csv("baby_trade.csv")
df_tb2=pd.read_csv("baby_info.csv")
date=df_tb2['birthday'].astype('str')#转换类型
type(day)#查看类型
year=df_tb2['birthday'].astype('str').apply(lambda x:x[0:4])#截取前4列
year.astype('int')#转换成int类型
age=year.astype('int').apply(lambda x: 2020-x)#现在时间减去出生日期
df_tb2['age']=age#添加新的一列
df_tb2

运行结果:
在这里插入图片描述

day=df_tb2['day'].astype('str')#转换类型
type(day)#查看类型
day=df_tb2['day'].astype('str').apply(lambda x:x[0:4])
day
day.astype('int')
df_tb2['2013~2015年销售量']=day
df_tb2

运行结果:
在这里插入图片描述

df_tb2.groupby('2013~2015年销售量').sum().sort_values(by='2013~2015年销售量', ascending=False).head(3)['buy_mount']#分组求和排序

运行结果:
在这里插入图片描述

num=df_tb2['gender'].value_counts().values#对gender分组求和
num=np.unique(num)#删除重复
num=np.append(num,955)#新增一列为总数量
num=DataFrame(num,index=['不知道','男','女','总数量'])
num.T#横向输出

运行结果:
在这里插入图片描述

ages=df_tb2['age'].value_counts().sort_index().values
ages=np.append(ages,955)
ages=DataFrame(ages,index=['五岁','六岁','七岁','八岁','九岁','十岁','十一岁','十二岁','十三岁','十四岁','十五岁','十六岁','十七岁','十八岁','三十六岁','总数量'])
ages.T

运行结果:
在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值