pandas.dataframe_Python干货整理:处理Pandas Data Frame中的行和列

数据帧是一种二维数据结构,即数据以表格方式排列成行和列。

我们可以对行或列执行基本操作,如选择、删除、添加和重命名。

今天将使用nba.csv档案。

处理列

为了处理列,我们对列执行基本操作,如选择、删除、添加和重命名。

3ba55c8b49efd476042e9c9671b2f945.png

列选择:

为了在PandasDataFrame中选择一个列,我们可以通过调用它们的列名来访问它们。

# Import pandas package
import pandas as pd
  
# Define a dictionary containing employee data
data = {'Name':['Jai', 'Princi', 'Gaurav', 'Anuj'],
        'Age':[27, 24, 22, 32],
        'Address':['Delhi', 'Kanpur', 'Allahabad', 'Kannauj'],
        'Qualification':['Msc', 'MA', 'MCA', 'Phd']}
  
# Convert the dictionary into DataFrame 
df = pd.DataFrame(data)
  
# select two columns
print(df[['Name', 'Qualification']])

产出:

8adc0191b5635d15e22df55b607a4f31.png

柱加法:

在PandasDataFrame中添加一个列,将一个新列表声明为一个列并添加到现有的Dataframe中。

# Import pandas package 
import pandas as pd
  
# Define a dictionary containing Students data
data = {'Name': ['Jai', 'Princi', 'Gaurav', 'Anuj'],
        'Height': [5.1, 6.2, 5.1, 5.2],
        'Qualification': ['Msc', 'MA', 'Msc', 'Msc']}
  
# Convert the dictionary into DataFrame
df = pd.DataFrame(data)
  
# Declare a list that is to be converted into a column
address = ['Delhi', 'Bangalore', 'Chennai', 'Patna']
  
# Using 'Address' as the column name
# and equating it to the list
df['Address'] = address
  
# Observe the result
print(df)

产出:

b312cbf6a6e977320876db383fb900a9.png

列删除:

删除Pandas DataFrame中的列,可以使用drop()方法。通过删除具有列名的列来删除列。

# importing pandas module
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Name" )
  
# dropping passed columns
data.drop(["Team", "Weight"], axis = 1, inplace = True)
  
# display
print(data)

产出:

新输出没有传递的列。这些值被删除。

因为AXIS设置为1,并且由于Inplace是True,所以在原始数据帧中进行了更改。

删除列之前的数据帧-

9695b0b50224c4a308eaa11ce706de23.png

删除列后的数据帧-

621404ecc556865b553ebcd987f9bde8.png

处理行:

对行执行基本操作包括:选择、删除、添加和重命名。

行选择:
熊猫为从数据框架中检索行提供了一种独特的方法。DataFrame.loc[]方法用于从Pandas DataFrame检索行。行还可以通过将整数位置传递给伊洛克[]功能。

# importing pandas package
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Name")
  
# retrieving row by loc method
first = data.loc["Avery Bradley"]
second = data.loc["R.J. Hunter"]
  
  
print(first, "nnn", second)

产出:
如输出图像所示,返回了两个序列,因为两次都只有一个参数。

82e36f3017b683b10fe579bf71ae87c3.png

行加法:

在PandasDataFrame中添加一个Row,将旧的dataframe和新的数据连接起来。

# importing pandas module 
import pandas as pd 
    
# making data frame 
df = pd.read_csv("nba.csv", index_col ="Name") 
  
df.head(10)
  
new_row = pd.DataFrame({'Name':'Geeks', 'Team':'Boston', 'Number':3,
                        'Position':'PG', 'Age':33, 'Height':'6-2',
                        'Weight':189, 'College':'MIT', 'Salary':99999},
                                                            index =[0])
# simply concatenate both dataframes
df = pd.concat([new_row, df]).reset_index(drop = True)
df.head(5)

产出:添加行之前的数据帧-

7f6271c16f71a804dd8bed16c02517e0.png

添加行后的数据帧-

4fe0002cef5c3e5601b4a25c78792aa6.png

行删除:

用Drop()方法删除PandasDataFrame中的一行,通过按索引标签删除行。

# importing pandas module
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Name" )
  
# dropping passed values
data.drop(["Avery Bradley", "John Holland", "R.J. Hunter",
                            "R.J. Hunter"], inplace = True)
  
# display
data

产出:
如输出图像所示,新输出没有传递的值。这些值被删除,并在原始数据框架中进行更改,因为Inplace是True。在删除值之前的数据帧-

310841ebc95117064b4d9268479c7f30.png

删除值后的数据帧-

621404ecc556865b553ebcd987f9bde8.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值