分析文本数据时经常要对csv文件做处理,用pandas在对表格数据取值时经常会忘了怎么操作,下面做一个小的总结,只涉及经常用的一些操作。
train.csv内容如下:
list1 | list2 | list3 |
---|---|---|
A | a | 1 |
B | b | 2 |
C | c | 3 |
D | d | 4 |
E | e | 5 |
import pandas as pd
data = pd.read_csv('train.csv')
# 切片取某几行值。第二三行
print(data[1:3])
# 取某几列。第一二列
print(data[['list1','list2']])
# 取某行某列的值,即具体单元格。第一行第二列
print(data.iloc[0:1, 1:2])
# 或者
print(data.loc[0,'list2'])
# 或者
print(data.iat[0,1])
# 按条件取值,第三列大于2的所有行
print(data[data['list3']>2])
# 按条件取值,第三列行值等于C的单元格
print(data.loc[data['list1']=='C','list3'])
其中 iloc 只能用数字索引,不能用索引名,loc相反