基于numpy构建的pandas库,提供了使得数据分析变得更快更简单的高级数据结构和操作工具。
-
对象的创建
pandas series对象
创建series
数据支持多种类型
数据类型可以被强制转换
用一维的numpy数组创建
字典创建,若指定index,则会到字典的键中筛选,找不到,值为nan
从二维数组构建
可以显示声明索引,如果没有声明,则使用默认的整数索引:
针对Null的操作
Pandas提供了一些便利函数用于处理这个数据。
isnull():用于创建掩码数组
notnull():isnull()的反操作
dropna(): 返回过滤后的数据
fillna(): 返回填充后的数据
Pandas 提供的 merge() 函数能够进行高效的合并操作,这与 SQL 关系型数据库的 MERGE 用法非常相似。merge 翻译为“合并”,指的是将两个 DataFrame 数据表按照指定的规则进行连接,最后拼接成一个新的 DataFrame 数据表。
merge() 函数的法格式如下:
pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None,left_index=False, right_index=False, sort=True,suffixes=('_x', '_y'), copy=True)
https://cloud.tencent.com/developer/article/1640799