主要参考:https://www.jianshu.com/p/0f6749c23d0f
pandas(Panel data) 是基于numpy的一个开源python 库,用于分析数据、数据清洗和准备等工作。
两类数据结构:Series(序列):类似于numpy中的一维数组
DataFrame(数据框):类似于numpy中的二维数组
Series(序列)
通过一维数组创建序列:
import numpy as np
import pandas as pd
arr = np.arange(5)
ser = pd.Series(arr)
>>> series02 = pd.Series([34.5, 56.7, 45.6])
>>> series02
0 34.5
1 56.7
2 45.6
dtype: float64
>>> series02.index = ['x', 'y', 'z'] # 可以修改索引
>>> series02
x 34.5
y 56.7
z 45.6
dtype: float64
>>> series02.values = ['22', '33', '44'] # 但是不能修改值
Traceback (most recent call last):
File "D:\Python36\lib\site-packages\pandas\core\generic.py", line 5167, in __setattr__
object.__setattr__(self, name, value)
AttributeError: can't set attribute
>>> series02.values
array([34.5, 56.7, 45.6])
>>> series03 = pd.Series([98, 56, 88], index=['数学', '语文&#