在数据中,选择需要的行或者列方法
方法一:
基础索引方式,就是直接引用
方法二:
ioc[行索引名称或者条件,列索引名称或者标签]
iloc[行索引位置,列索引位置]
#注意,区分ioc和iloc
import pandas as pd
import numpy as np
import os
os.chdir(r'your path')
df=pd.read_csv('your file.csv',encoding='utf-8',dtype={'行索引':str})
df.info()#查看数据变量类型
df.head(10)#
df.columns#输出列标签
#直接引用
df[['user_id','cat1']].head(5)#取多个字段
df[['user_id','cat1']][1:5]#取多个字段的某些行
#选择的是标签,左臂右臂
df.loc[3:4]
#选取列,列标签以列表形式传入
df.loc[:,['user_id','man_id']].head(10)
#
df.loc[1:3,['user_id','man_id']]
#
df.loc[df.user_id=='123456',['user_id','man_id']]
#满足某个ID或者购买数量大于3的列标签数据,
df.loc[(df.user_id=='123456')|(df.buy_mount>3),['user_id','man_id']]
#iloc选择的是位置,左臂由开
#df.iloc[1:3]
#选择第二行到第四行
df.iloc[:,1:4]
#选择第二行、第11行 第一列 第二列
df.iloc[[1,10],[0,2]]
#loc与iloc区别
loc:按标签
iloc:按位置