import numpy as np
import pandas as pd
import os
os.chdir('') #切换到文件存放路径
df = pd.read_csv('',encoding='',dtype={'user_id':str})
df.head()
df.info()
df.head(10)
colums = df.columns
df[['user_id','cat1']].head()
df1 = df[['user_id','cat1']][1:5]
# 定位索引 loc的标签操作
df_row = df.loc[3:4] #对行进行操作
df_column = df.loc[:,['user_id','buy_mount']].head() #对列进行操作
df_filter = df.loc[(df.user_id=='917056007')|(df.buy_mount>3),['user_id','buy_mount']] #'|'或
# 定位索引 iloc的位置操作
df2 = df.iloc[1:3]
df3 = df.iloc[:,1:4]
df4 = df.iloc[:,[0,2]] #对列进行操作
Pandas数据筛选
最新推荐文章于 2023-04-14 17:54:45 发布
该博客介绍了使用Pandas库进行数据处理的基本操作,包括读取CSV文件,查看数据前几行,获取数据信息,选择特定列以及通过loc和iloc进行行和列的定位。示例中展示了如何根据标签或条件筛选数据,并展示了如何按位置选取数据行和列。
摘要由CSDN通过智能技术生成