关于pandas的简单运用
pandas是基于numpy数组构建的,但二者最大的不同是pandas是专门为处理表格和混杂数据设计的,比较契合统计分析中的表结构,而numpy更适合处理统一的数值数组数据。pandas数组结构有一维Series和二维DataFrame。
下边先演示pandas的Series基础用法:
from pandas import Series
# Series是一维数组
s = Series(data=[1, 2, 3, 'foor'])
print(s) # 展示出的第一列为隐式索引
'''
0 1
1 2
2 3
3 foor
dtype: object
'''
# index用来指定显示索引
s = Series(data=[1, 2, 3, 'fout'], index=['a', 'b', 'c', 'd'])
print(s)
'''
a 1
b 2
c 3
d fout
dtype: object
'''
# 显示索引可以增强Series的可读性
dic = {
'语文': 100,
'数学': 50,
'理综': 200
}
s = Series(data=dic)
print(s)
print(s.index) # 返回索引
print(s.values) # 返回值
print(s.dtype) # 元素的类型
'''
语文 100
数学 50
理综 200
dtype: int64
Index(['语文', '数学', '理综'], dtype='object')
[100 50 200]
int64
'''
s = Series(data=np.random.randint(60, 100, size=(10,)))
# print(s)
print(s.head(3)) # 显示前3个数据
'''
0 97
1 76
2 72
dtype: int32
'''
print