教程【2】DataFrame选择数据-1

最新推荐文章于 2024-05-09 08:45:52 发布

a64506青竹

最新推荐文章于 2024-05-09 08:45:52 发布

阅读量846

点赞数

本文链接：https://blog.csdn.net/a645061612/article/details/89630959

版权

import numpy as np
import pandas as pd

dates=pd.date_range('20160227',periods=6)
df=pd.DataFrame(np.random.rand(6,4),index=dates,columns=list('ABCD'))
print(df)
print('*'*50)
# 假如我们要选择A列的数据进行操作：df['a']
# print(df['A'])
# print('*'*50)
# 还可以使用数组的切片操作，但是注意了，切片 第一个是行的索引，第二个是列的索引
#
# 注意 用切片，用的是原始的小标索引【0：5】，有冒号
# 因此，df.[1:],是从第二行数据到最后
# 要是单行或者间断的获取，
# 需要用df.ix[[]],中括号表示，有行 和列，ix命令快废除了，用 iloc方法
print(df[1:3])
print(df.ix[1:3,:])
print(df.iloc[1:3,:])
print('*'*50)
# 如果你想使用这个方法得到列，那就会出现错误
# df['A':'B']

# 我们还可以使用行标签来指定输出的行
# 千万注意：如果通过索引标签获取数据的话，末端标签所对应的值是可以返回的！
# 在一维数组中，就无法通过索引标签获取数据，这也是序列不同于一维数组的一个方面。
print(df['20160301':'20160303'])
print('*'*50)

# DataFrame的loc方法是帮助选择数据的，loc仅能使用标签不能使用数字
# 比如选择索引位置为0的一行数据（注意我们是用dates作为索引的）
print(df.loc[dates[0]])
print('*'*50)
# 选择多列数据的写法
print(df.loc[:,['A','B']])
print('*'*50)
# 假如我们要选择的是一个局部数据，是行和列的交叉区域
print(df.loc['20160227':'20160228', ['A','B']])
print('*'*50)
# 假如我们只选择某一个数据，可以指定行和列：
print(df.loc[dates[0],'A'])
print('*'*50)
ser2 = pd.Series(np.arange(3), index = ['a', 'b', 'c'])
print(ser2)
print (ser2[-1]) # 索引值类型不是整数
print('*'*50)
# 2
ser3 = pd.Series(range(3), index = [-5, 1, 3])
print(ser3)
print (ser3.iloc[2])  # 使用iloc避免直接用[2]产生的歧义
# 2
print

print ('对DataFrame使用整数索引')
frame = pd.DataFrame(np.arange(6).reshape((3, 2)), index = [2, 0, 1])
print (frame)
'''
   0  1
2  0  1
0  2  3
1  4  5
'''
print (frame.iloc[0])
'''
0    4
1    5
'''

a64506青竹

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
教程【2】DataFrame选择数据-1

import numpy as npimport pandas as pddates=pd.date_range('20160227',periods=6)df=pd.DataFrame(np.random.rand(6,4),index=dates,columns=list('ABCD'))print(df)print('*'*50)# 假如我们要选择A列的数据进行操作：df['...
复制链接

扫一扫