pandas
pandas 是python中的一个数据分析包,里边有大量的数据处理的函数和方法
Series
Series函数中,参数为数组(可为一维数组,可为多维数组),但是返回后,输出的是每个元素带有特定索引的数组
一维数组:
import pandas as pd
obj = pd.Series([1,2,3,4]) # 带有标签的数组,
print(obj)
0 4
1 5
2 6
3 7
dtype: int64
二维数组
import pandas as pd
obj = pd.Series([[4,5],[6,7]]) # 带有标签的数组,
print(obj)
0 [4, 5]
1 [6, 7]
dtype: object
多维数组
import pandas as pd
obj = pd.Series([[[4],[5]],[6,9],[7,0]]) # 带有标签的数组,
print(obj)
0 [[4], [5]]
1 [6, 9]
2 [7, 0]
dtype: object
DataFrame
DataFrame是一个表格型的数据结构,他既有行索引,也有列索引。他是通过一个键值对(k,v)来创建的,k代表的就相当于一个表格的表头,v代表的是这个表头所对应的值
import pandas as pd
obj = {
"name":['lili', 'wangwang','zhaozhoa', 'qianqian'],
"major":['se','cs','math','english'],
'grade':['da1','da1','da2','da3']
}
df = pd.DataFrame(obj)
print(df)
name major grade
0 lili se da1
1 wangwang cs da1
2 zhaozhoa math da2
3 qianqian english da3