Python Pandas行列的选择、添加、删除

目录

1.列 基础操作 :

2.行 基础操作

3.行的交换,顺序更换:

4.Series基本操作 

5.DataFrame基本操作


1.列 基础操作 :

import pandas as pd
import numpy as np
d = {'one': pd.Series([1, 2, 3], index=['a', 'b', 'c']),
'two': pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])}
df = pd.DataFrame(d)
# 筛选one列数据
print(df['one'])
# 新增列,并添加数据
df['three'] = pd.Series([10, 20, 30], index=['a', 'b', 'c'])
print(df)
# 两列数据相加
df['four'] = df['one'] + df['three']
print(df)
# 删除one 列数据
del df['one']
print(df)

结果:

a    1.0
b    2.0
c    3.0
d    NaN
Name: one, dtype: float64
   one  two  three
a  1.0    1   10.0
b  2.0    2   20.0
c  3.0    3   30.0
d  NaN    4    NaN
   one  two  three  four
a  1.0    1   10.0  11.0
b  2.0    2   20.0  22.0
c  3.0    3   30.0  33.0
d  NaN    4    NaN   NaN
   two  three  four
a    1   10.0  11.0
b    2   20.0  22.0
c    3   30.0  33.0
d    4    NaN   NaN

2.行 基础操作

import pandas as pd
d = {'one': pd.Series([1, 2, 3], index=['a', 'b', 'c']),
'two': pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])}
df = pd.DataFrame(d)
print("1---------------")
print(df)
print("2筛选索引是b 行数据---------------")
print(df.loc['b'])
print("3筛选索引是1 行数据---------------")
print(df.iloc[1])
print("4筛选索引2和3 行数据---------------")
print(df[2:4])
print("5追加数据---------------")
df = df.append(pd.DataFrame([[5, 6], [7, 8]], columns=['one', 'two']))
print(df)
print("6删除索引为0的行---------------")
df = df.drop(0)
print(df)

结果:

1---------------
   one  two
a  1.0    1
b  2.0    2
c  3.0    3
d  NaN    4
2筛选索引是b 行数据---------------
one    2.0
two    2.0
Name: b, dtype: float64
3筛选索引是1 行数据---------------
one    2.0
two    2.0
Name: b, dtype: float64
4筛选索引2和3 行数据---------------
   one  two
c  3.0    3
d  NaN    4
5追加数据---------------
   one  two
a  1.0    1
b  2.0    2
c  3.0    3
d  NaN    4
0  5.0    6
1  7.0    8
6删除索引为0的行---------------
   one  two
a  1.0    1
b  2.0    2
c  3.0    3
d  NaN    4
1  7.0    8

3.行的交换,顺序更换:

import pandas as pd
import numpy as np
df = pd.DataFrame(np.arange(25).reshape(5, -1))
print(df)
a, b = df.iloc[1].copy(), df.iloc[2].copy()
df.iloc[1], df.iloc[2] = b, a
print("-----------------------")
print(df)

结果:

    0   1   2   3   4
0   0   1   2   3   4
1   5   6   7   8   9
2  10  11  12  13  14
3  15  16  17  18  19
4  20  21  22  23  24
-----------------------
    0   1   2   3   4
0   0   1   2   3   4
1  10  11  12  13  14
2   5   6   7   8   9
3  15  16  17  18  19
4  20  21  22  23  24

4.Series基本操作 

import pandas as pd
import numpy as np
data = pd.Series(np.random.randint(0,4,5))
print("-----------")
print(data)
print("返回行轴标签列表-----------")
print(data.axes)
print("如果系列为空,则返回True-----------")
print(data.empty)
print("返回底层数据的维数,默认定义:1-----------")
print(data.ndim)
print("返回基础数据中的元素数-----------")
print(data.size)
print("将系列作为ndarray返回-----------")
print(data.values)
print("返回前n行-----------")
print(data.head(3))
print("返回最后n行-----------")
print(data.tail(2))

结果:

-----------
0    2
1    0
2    0
3    1
4    0
dtype: int32
返回行轴标签列表-----------
[RangeIndex(start=0, stop=5, step=1)]
如果系列为空,则返回True-----------
False
返回底层数据的维数,默认定义:1-----------
1
返回基础数据中的元素数-----------
5
将系列作为ndarray返回-----------
[2 0 0 1 0]
返回前n行-----------
0    2
1    0
2    0
dtype: int32
返回最后n行-----------
3    1
4    0
dtype: int32

5.DataFrame基本操作

import pandas as pd
# Create a Dictionary of series
d = {'Name': pd.Series(['Tom', 'James', 'Ricky', 'Vin', 'Steve', 'Minsu', 'Jack']),
     'Age': pd.Series([25, 26, 25, 23, 30, 29, 23]),
     'Rating': pd.Series([4.23, 3.24, 3.98, 2.56, 3.20, 4.6, 3.8])}
# Create a DataFrame
data = pd.DataFrame(d)
print(data)
print("获取列名")
print(data.columns)
print("转置行和列--------------")
print(data.T)
print("返回一个列,行轴标签和列轴标签作为唯一成员--------------")
print(data.axes)
print("返回此对象中的数据类型(dtypes)")
print(data.dtypes)
print("如果NDFrame完全为空【无项目】,则返回为True;如果任何轴的长度为0")
print(data.empty)
print("轴/数组维度大小")
print(data.ndim)
print("返回表示DataFrame的维度的元组")
print(data.shape)
print("NDFrame中元素数")
print(data.size)
print("NDFrame的Bunpy表示")
print(data.values)
print("返回开头前n行")
print(data.head(3))
print("返回最后n行")
print(data.tail(2))

结果:

D:\Python36\python.exe C:/Users/17653/Desktop/测试.py
    Name  Age  Rating
0    Tom   25    4.23
1  James   26    3.24
2  Ricky   25    3.98
3    Vin   23    2.56
4  Steve   30    3.20
5  Minsu   29    4.60
6   Jack   23    3.80
获取列名
Index(['Name', 'Age', 'Rating'], dtype='object')
转置行和列--------------
           0      1      2     3      4      5     6
Name     Tom  James  Ricky   Vin  Steve  Minsu  Jack
Age       25     26     25    23     30     29    23
Rating  4.23   3.24   3.98  2.56    3.2    4.6   3.8
返回一个列,行轴标签和列轴标签作为唯一成员--------------
[RangeIndex(start=0, stop=7, step=1), Index(['Name', 'Age', 'Rating'], dtype='object')]
返回此对象中的数据类型(dtypes)
Name       object
Age         int64
Rating    float64
dtype: object
如果NDFrame完全为空【无项目】,则返回为True;如果任何轴的长度为0
False
轴/数组维度大小
2
返回表示DataFrame的维度的元组
(7, 3)
NDFrame中元素数
21
NDFrame的Bunpy表示
[['Tom' 25 4.23]
 ['James' 26 3.24]
 ['Ricky' 25 3.98]
 ['Vin' 23 2.56]
 ['Steve' 30 3.2]
 ['Minsu' 29 4.6]
 ['Jack' 23 3.8]]
返回开头前n行
    Name  Age  Rating
0    Tom   25    4.23
1  James   26    3.24
2  Ricky   25    3.98
返回最后n行
    Name  Age  Rating
5  Minsu   29     4.6
6   Jack   23     3.8

Process finished with exit code 0
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: PyCharm是一种Python集成开发环境(IDE),被广泛用于开发Python程序。而PandasPython中一个重要的数据分析库。 在PyCharm 3.7中,可以通过简单的步骤来使用Pandas库。首先,需要确保已经安装了Pandas库。可以在PyCharm中使用终端或命令提示符来安装Pandas,运行命令"pip install pandas"即可。安装完成后,可以在Python代码中使用import pandas语句来导入Pandas库。 一旦导入了Pandas库,就可以使用Pandas中的各种数据结构和函数来进行数据分析。例如,Pandas提供了两个主要的数据结构:Series和DataFrame。Series是一维的标记数组,类似于一数据。DataFrame是二维的表格结构,由多个Series组成,类似于一张表格。 通过Pandas,可以方便地读取和处理各种数据。Pandas提供了函数来读取和写入各种数据格式,如CSV、Excel、SQL数据库等。读取数据后,可以使用Pandas提供的函数来进行数据清洗、转换、过滤和分析等操作。 除了数据处理,Pandas还提供了很多统计和可视化函数,用于数据分析和探索。可以使用Pandas的函数来计算各种统计指标,如平均值、中位数、标准差等。此外,Pandas还可以与Matplotlib等库集成,方便地进行数据可视化分析。 总之,Pandas是一种强大的数据分析库,可以在PyCharm 3.7中方便地使用。它提供了丰富的数据处理函数和工具,可以快速高效地完成数据分析任务。使用Pandas,可以轻松处理各种数据,并从中提取有价值的信息。 ### 回答2: 在PyCharm 3.7版本中,Pandas是一个非常强大且广泛使用的Python库。它提供了高性能的数据结构和数据分析工具,使得数据处理和分析变得更加简单和高效。 首先,Pandas的最主要数据结构是Series和DataFrame。Series是一维的标签数组,类似于一个带标签的数组,可以存储不同类型的数据。而DataFrame是一个二维的表格结构,可以存储多个Series,并且可以对表格进行灵活的操作和处理。 在PyCharm中,我们可以轻松地创建和操作这些数据结构。我们可以使用Pandas的read_csv()函数来读取CSV文件并将其转换为DataFrame。然后,我们可以使用DataFrame的各种函数和方法来对数据进行切片、筛选、排序、合并等操作。 此外,Pandas还具有强大的数据清洗和处理功能。我们可以使用dropna()函数删除缺失的值,使用fillna()函数填充缺失值,使用duplicated()函数去除重复值,并使用replace()函数替换特定的值。 同时,Pandas还内置了很多数据分析和统计函数。我们可以使用mean()、median()、max()、min()等函数计算数据的统计指标,使用corr()函数计算数据的相关性,使用groupby()函数进行数据分组和聚合等。 在PyCharm的代码编辑器中,我们可以借助Pandas的自动补全功能和代码提示来提高代码编写的效率。此外,我们还可以使用PyCharm的调试工具来分析和调试Pandas代码,以解决潜在的问题。 总之,Pandas是PyCharm 3.7中一个非常有用的库,它为数据处理和分析提供了强大的工具和功能。无论是初学者还是专业的数据科学家,都可以通过Pandas来进行数据处理和分析,并提取有价值的信息。 ### 回答3: Pandas是一个开源的Python数据分析库,在PyCharm 3.7中可以非常方便地使用它。 首先,我们需要在PyCharm中安装Pandas。我们可以使用PyCharm自带的包管理器pip来安装Pandas,只需在PyCharm的终端中执行指令`pip install pandas`。 一旦安装完成,我们可以在PyCharm中导入Pandas库并使用它的各种功能来进行数据分析和处理。例如,我们可以使用Pandas的DataFrame对象来加载和处理数据集。DataFrame类似于一张表格,可以将数据以行列的形式组织起来,非常方便进行数据的筛选、转换和计算。 除了DataFrame,Pandas还提供了许多其他有用的功能,例如数据的读取与写入,数据的合并与连接,以及数据的统计分析等。我们可以使用Pandas提供的函数和方法来快速完成各种数据处理任务。 在PyCharm中编写Pandas代码时,可以利用PyCharm的自动补全、代码提示和调试等功能,提高开发效率。同时,PyCharm还提供了友好的界面和代码编辑器,能够让我们更加方便地查看和编辑Pandas代码。 总之,使用PyCharm 3.7中的Pandas可以使数据分析和处理更加高效和便捷。它提供了丰富的功能和工具,可以帮助我们进行数据的加载、处理和分析,让我们能够更好地理解和利用数据。无论是初学者还是专业数据分析师,都可以通过PyCharm和Pandas来提升工作效率和数据分析能力。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值