[python]pandas操作(持续更新中)

这篇博客主要介绍了pandas的常用操作,包括map、apply和applymap的用法,以及get_dummies的功能。map针对Series的每个值进行映射,apply则可以按行/列对DataFrame应用函数,applymap则作用于DataFrame的每个元素。此外,还提到了get_dummies用于处理分类变量。
摘要由CSDN通过智能技术生成

内容较多可使用Ctrl+f搜索,大部分常用的应该有,都是本人使用过的

#两种方式
df = pd.DataFrame(data = np.random.randint(0,150,size = (5,3)),
             columns=['Python','En','Math'],
             index = list('ABCDE'),dtype=np.float32)

df = pd.DataFrame(data = {
   'Python':np.random.randint(100,150,size = 5),
                     'En':np.random.randint(0,150,size = 5),
                     'Math':np.random.randint(0,150,size = 5)},index = list('ABCDE'))

df.sort_index(ascending = False)  #索引排序,ascending默认为True,从小到大
df.head(10) # 显示头部10行,默认5个
df.tail() # 显示末尾10行,默认5个
df.shape # 查看形状,行数和列数
df.dtypes # 查看数据类型
df.index # 行索引
df.columns # 列索引
df.values # 对象值,二维ndarray数组
df.describe() # 查看数值型列的汇总统计,计数、平均值、标准差、最小值、四分位数、最大值
df.info() # 查看列索引、数据类型、非空计数和内存信息
df2.mean()  #平均数
df2.std() # 标准差
df.isnull()  
df.dropna() #空数据过滤
df.fillna(1024)  #填充空数据
df.take(index)  #根据得到的index排序,可以少于原来的index
df.median() #中位数
df.quantile(q = [
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值