Pandas系列教程（四）

最新推荐文章于 2024-09-09 18:34:56 发布

看透说不透

最新推荐文章于 2024-09-09 18:34:56 发布

阅读量322

点赞数

分类专栏： Pandas系列学习教程文章标签： python pandas dataScience

7 篇文章 2 订阅

订阅专栏

# 导入需要的库

import pandas as pd
import sys

print('Python version',sys.version)
print('Pandas version',pd.__version__)

Python version 3.6.5 |Anaconda, Inc.| (default, Apr 29 2018, 16:14:56) 
[GCC 7.2.0]
Pandas version 0.23.0

# 我们的数据集,一个维度
d = [0,1,2,3,4,5,6,7,8,9]

# 生成数据帧
df = pd.DataFrame(data=d)
df

# 改变列名(关键字)
df.columns = ['Rev']
df

# 增加列
df['NewCol'] = 5
df

# 修改新的列
# df['NewCol'] = df['NewCol'] + 1
df.NewCol = df.NewCol + 1

df

# 删除列
del df['NewCol']
df

# 增加多列
df['test'] = 3
df['col'] = df['Rev']
df

# 改变索引的值
i = ['a','b','c','d','e','f','g','h','i','j']
df.index = i

df

# 通过df.loc()选择数据帧的某一条记录
df.loc['a']

Rev     0
test    3
col     0
Name: a, dtype: int64

# 选择片(slices) 注意a与d两端都是包括的
# 传入的也可以是整数
df.loc['a':'d']

# df.iloc(low,high)函数,左边包括，右边不包括,其中low与high需要是整数

df.iloc[0:3]

# 选择一列
df['Rev']

a    0
b    1
c    2
d    3
e    4
f    5
g    6
h    7
i    8
j    9
Name: Rev, dtype: int64

# 选择多列
df[['Rev','test']]

# 指定行加指定列
# 用df.ix[0:3,'Rev']也可以实现，但将被deprecated
df.loc[df.index[0:3],'Rev']

a    0
b    1
c    2
Name: Rev, dtype: int64

#df.ix[5:,'col']
df.loc[df.index[5:],'col']

f    5
g    6
h    7
i    8
j    9
Name: col, dtype: int64

# 选择多行多列
df.loc[df.index[0:3],['col','test']]

# 选择上面的n行，缺省值为5
df.head()

# 选择最后的若干输出,缺省为５
df.tail()

关注

专栏目录