pandas常用的函数

import pandas as pd

#字典转成DataFrame数据
df = pd.DataFrame({"key":["a","b"],"data":[1,2]})
#	key	value
#0	a	1
#1	b	2

#计算该属性中各类出现的频次
df['key'].value_counts()
#key
#a    1
#b    1

#也可以另一种调用方法
pd.value_counts(df['data'])
#data
#1    1
#2    1

计数函数

value_counts( values, sort=True, ascending=False, normalize=False, bins=None, dropna=True)

参数名意义
sort是否排序,默认有序
ascending为True的时候升序,默认降序
normalize是否标准化数据
bins分段,将数据分为n区间
dropna是否删除缺省值,默认删除

PS:loc是通过"索引"找数据,可以限定index和column找到数据;

         iloc通过位置找数据,可切片等操作。

参考:https://www.w3resource.com/pandas/dataframe/

清洗缺省数据的函数

DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)

参数名意义
axis默认值为0,表示删除包含缺失值的行;设置为1表示删除包含缺失值的列
how默认值为’any’,表示只要存在一个缺失值就删除整行或整列;设置为’all’表示只有当整行或整列都是缺失值时才删除
thresh表示在删除之前需要满足的非缺失值的最小数量。如果行或列中的非缺失值数量小于等于thresh,则会被删除
subset用于指定要检查缺失值的特定列名或行索引
inplace表示是否对原始数据进行就地修改

删除数据的函数

df.drop(labels = None, axis = 0, index = None, columns = None, level = None, inplace = False, errors = 'raise')

参数名意义
labels要删除的列或者行,如果要删除多个,传入列表
axis默认值为0,表示删除包含缺失值的行;设置为1表示删除包含缺失值的列
index指定的一行或多行
columns指定的一列或多列
inplace表示是否对原始数据进行就地修改

替代数据的函数

map中的参数为字典类型
df['列名'] = df['列名'].map({'key1':'value1', 'key2':'value2',...})

  • 8
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值