loc函数、iloc函数、df.drop()函数的用法

1.loc函数、iloc函数

loc函数:通过行索引 “Index” 中的具体值来取行数据(如取"Index""A"的行)

iloc函数:通过行号来取行数据(如取第二行的数据)
df = pd.DataFrame(np.arange(20).reshape(5,4),index=list('abcde'),columns=['A', 'B', 'C', 'D'])
######### 提取行数据############
#取索引为'a'的行
df.loc['a']
# 输出:
A    0
B    1
C    2
D    3

#取第二行数据,索引为'a'的行就是第一行,所以结果相同
df.iloc[1]
# 输出:
A    4
B    5
C    6
D    7
######### 提取列数据############
#取AB列的数据
df.loc[:,['A','B']] 
# 输出:

    A	B
a	0	1
b	4	5
c	8	9
d	12	13
e	16	17

#取第0,1列的数据
df.iloc[:,[0,1]] 
# 输出:

    A	B
a	0	1
b	4	5
c	8	9
d	12	13
e	16	17

######### 提取指定行、指定列数据############
#提取index为'c','d',列名为'A','B'中的数据
df.loc[['c','d'],['A','B']] 

# 输出:
	A	B
c	8	9
d	12	13

#提取第02行,第01列中的数据
df.iloc[[0,2],[0,1]]

# 输出:
	A	B
a	0	1
c	8	9

######### 提取所有数据############
#取所有列的数据
df.loc[:,:] 

# 输出:
	A	B	C	D
a	0	1	2	3
b	4	5	6	7
c	8	9	10	11
d	12	13	14	15
e	16	17	18	19

#取所有行数据
df.iloc[:,:] 
# 输出:
	A	B	C	D
a	0	1	2	3
b	4	5	6	7
c	8	9	10	11
d	12	13	14	15
e	16	17	18	19

2.drop()函数的用法

'''
drop()函数的用法:
DataFrame.drop(labels=None,axis=0, index=None, columns=None, inplace=False)

labels:就是要删除的行列的名字,用列表给定
axis:默认为 0,指删除行,因此删除 columns 时要指定 axis=1;
index:直接指定要删除的行
columns:直接指定要删除的列
inplace=False : 默认该删除操作不改变原数据,而是返回一个执行删除操作后的 新 dataframe;
inplace=True : 则会直接在原数据上进行删除操作,删除后无法返回。

'''
df = pd.DataFrame(np.arange(20).reshape(5,4), columns=['A', 'B', 'C', 'D'])
# 删除B,C两列
# 方法一:
df.drop(['B', 'C'], axis=1) #一定要指定axis=1,否则会报错,因为drop默认是删除行数据的
# 方法二:
df.drop(columns=['B', 'C'])

# 删除B,C两列输出结果:
	A	D
0	0	3
1	4	7
2	8	11
3	12	15
4	16	19

# 删除索引值为13的行数据
df.drop(index=[1, 3])

# 输出结果:
	A	B	C	D
0	0	1	2	3
2	8	9	10	11
4	16	17	18	19


drop()函数删除指定的行,按照某列的值对df数据行的索引进行筛选并删除
例如:剔除3分的中性评论

// An highlighted block
df[df['score'] == 3] # 找到score这一列中值为3的所有行数据
写法1:
df = df.drop(df[df['Score']==3].index)
写法2:
df=df[df['Score']!=3]

一个表中含有很多的列,我想要删除其中指定的几列’Id’, ‘ProductId’, 'UserId’

df = df.drop(['Id', 'ProductId', 'UserId'],axis=1)
  • 10
    点赞
  • 79
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 在 Python 中,df1. 通常是作为 DataFrame 对象的实例属性使用的,表示对该 DataFrame 对象进行操作或访问其中的属性和方法。DataFrame 是 Pandas 库中的一个重要数据结构,类似于二维数组或表格,用于处理结构化数据。下面是一些常见的 df1. 用法示例: 1. df1.shape:返回 DataFrame 的行数和列数,以元组形式呈现。 2. df1.head(n):返回 DataFrame 的前 n 行数据,默认返回前 5 行。 3. df1.tail(n):返回 DataFrame 的后 n 行数据,默认返回后 5 行。 4. df1.columns:返回 DataFrame 的列名。 5. df1.index:返回 DataFrame 的行索引。 6. df1.values:返回 DataFrame 的值,以 NumPy 数组形式呈现。 7. df1.describe():返回 DataFrame 的统计描述信息,包括计数、均值、标准差、最小值、最大值等。 8. df1.info():返回 DataFrame 的基本信息,包括每列的数据类型、非空值数量等。 9. df1.groupby():按照指定的列分组,对分组后的数据进行聚合操作。 10. df1.drop():删除指定行或列。 11. df1.loc[]:按照标签(行、列名)进行数据访问和操作。 12. df1.iloc[]:按照位置(行、列号)进行数据访问和操作。 以上仅是 df1. 用法的一部分,具体使用方式还需要根据具体情况而定。 ### 回答2: 在Python中,df1通常用作DataFrame对象的一个名称。DataFrame是pandas库中的一个重要数据结构,类似于一张二维表格或Excel中的表。 首先,我们需要导入pandas库,并创建一个DataFrame对象,命名为df1,可以使用以下语法: ``` import pandas as pd data = {'Name': ['Tom', 'Jack', 'Steve', 'Ricky'], 'Age': [28, 34, 29, 42], 'Salary': [2500, 3000, 2700, 4000]} df1 = pd.DataFrame(data) ``` 上述代码中,我们创建了一个Python字典data,字典中的键('Name','Age','Salary')表示DataFrame中的列名,而对应的值(['Tom', 'Jack', 'Steve', 'Ricky'],[28, 34, 29, 42],[2500, 3000, 2700, 4000])则是各列的数据。 创建完df1后,我们可以使用各种方法和属性来操作和处理DataFrame对象。例如,我们可以获取DataFrame的形状(行数和列数): ``` shape = df1.shape print(shape) ``` 输出结果为(4, 3),表示df1有4行3列。 我们还可以获取DataFrame的列名: ``` columns = df1.columns print(columns) ``` 输出结果为Index(['Name', 'Age', 'Salary'], dtype='object'),表示df1的列名是'Name','Age'和'Salary'。 除此之外,df1还有其他许多功能和用法,例如对数据进行筛选、排序、合并、分组等操作,以及进行数据统计和可视化等。 不同的操作和需求会有不同的用法。总的来说,df1是pandas库中用于处理和操作二维数据的重要对象。 ### 回答3: 在Python中,df1通常是指一个DataFrame对象,它是pandas库中用于处理和分析数据的一个重要数据结构。DataFrame是一个二维的表格型数据结构,类似于电子表格或SQL中的表,可以容纳不同类型的数据,并且可以使用标签来标识行和列。 df1可以通过多种方式创建,其中一种常见的方式是从数据源(如csv文件、Excel表格、数据库等)中读取数据。例如,可以使用pandas的read_csv函数来读取csv文件并将其存储在df1中: ```python import pandas as pd df1 = pd.read_csv('data.csv') ``` 此时,df1将包含csv文件中的数据,并且可以通过列名和索引来访问和操作数据。例如,可以使用df1.columns属性来获取数据框的列名,使用df1.index属性来获取数据框的索引。 此外,df1还提供了丰富的方法和属性,用于对数据进行各种处理和分析。例如,可以通过df1.head()方法来查看数据框的前几行数据,默认显示前5行。可以使用df1.describe()方法来获取数据框中数值列的统计描述信息,如均值、标准差、最小值、最大值等。 除此之外,df1还支持许多其他操作,如选择特定的列、过滤行、统计数据、合并和拆分数据等。可以使用df1['column_name']来选择特定的列,使用df1[df1['column_name'] > value]来过滤出满足特定条件的行数据。 总之,df1是Python中pandas库中的一个DataFrame对象,它提供了方便的方法和属性,用于对数据进行处理和分析。通过df1可以轻松地读取、操作和分析数据,并在数据科学和数据分析中发挥重要作用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值