pandas常用代码段

pandas

查看基本信息
import pandas as pd

ted = pd.read_csv('ted.csv')
ted.head()
ted.shape

#对每一列数据进行统计,包括计数,均值,std,各个分位数等。
data.describe() 

# 查看数据类型
ted.dtypes

# 查看每列缺失值数量
ted.isna().sum()

# 统计某一列x中各个值出现的次数
data['x'].value_counts()    

# 按某列排序
ted.sort_values('comments').tail()

# correct for this bias by calculating the number of comments pey view
ted['comments_per_view'] = ted.comments / ted.views
读取tsv文件
df = pd.read_csv(file, sep='\t')

# 如果已有表头
df = pd.read_csv(file, header=0)
删除某几列
pd.drop(axis=1, columns=['a', 'b'])
取行取列
1. loc函数

loc是用实际的索引
在这里插入图片描述
比如我们现在有这么一个DataFrame

# 取x行数据
df.loc['x']

# 取多行数据
df.loc['x': 'z']
 
# 索引某行某列
df.loc['x', ['b', 'c']]

# 索引某列
df.loc[:, 'b']

注意: DataFrame的索引[1:3]是包含3这个元素的的, 和其他地方有区别

2. iloc函数

iloc是用行号列号来索引(从0开始计数)

# 索引单行
df.iloc[0]

# 索引多行
df.iloc[0:]

# 索引列数据
df.iloc[:, [1]]  
3. ix函数

ix是结合了前两种的混合索引

# 通过行号索引
df.ix[0]

# 通过行标签索引
df.ix['x']

另外, 取列数据的话也可以不用上面函数直接这样取:

# 取a列
df['a']
df.a

第二种有个小问题, 就是列名不能有空格

持续更新…

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值