第一部分:pandas包
一.pandas基本介绍
pandas:python里分析结构化数据的工具集。
基础是numpy:提供高性能矩阵运算
图形库matplotlib:提供数据可视化
二.pandas基本操作
1.一维、二维数组的创建和基本操作:
import numpy as np
import pandas as pd
s = pd.Series([1,2,3,4,np.NaN]) #pandas中的一维数据Series
dates = pd.date_range('20200301',periods=6)
# pandas中的二维数组DataFrame,行索引index,列索引columns
#创建DataFrame方法一:
data = pd.DataFrame(np.random.randn(6,4),index=dates,columns=list('abcd'))
data
Out[12]:
a b c d
2020-03-01 0.974217 1.415198 0.449173 0.309444
2020-03-02 -0.783394 1.642082 1.929648 -1.730744
2020-03-03 -1.412779 2.459838 0.793193 1.093348
2020-03-04 -2.860147 -1.633533 1.972606 -1.106984
2020-03-05 1.312970 -0.240283 -0.411076 -0.175680
2020-03-06 -0.277543 -0.525772 0.556319 0.938473
#创建DataFrame方法二:
d = {
'A'</