1.Pandas
三个核心数据类型:
1.series -- 数据系列 -- 一维数据
2.DataFrame -- 数据框/数据窗/数据表 -- 二维数据
3.Index -- 索引 -- 为Series和DataFrame对象提供索引服务
1.1 series
1.1.1 创建Series对象 -- 一维数据
方法1:
ser1 = pd.series(data=[420,380,500,520,150,230],
index=[f'{i}季度' for i in '一二三四三四'])
方法2:
ser1 = pd.series(data={
'一季度': 420,
'二季度': 380,
'三季度': 500,
'四季度': 520
})
1.1.2 Serier属性和方法
dtype/dtypes -- 属性类型
ser1.values -- 获取系列值 -- 返回数组
ser1.index.values -- 获取索引值
ser1.is_unique -- 判断序列元素是否唯一
ser1.unique -- 去重(重复值只取一个)
ser1.nunique() -- 不重复元素的个数 -- 返回唯一值的个数
ser1.value_counts() -- 统计每个元素的重复次数
ser1.hasnans -- 判断有无空值(有:返回True, 无:返回False)
单调性判断:
ser1.is_monotonic -- 是否具有单调性
ser1.is_monotonic_increasing -- 是否是单调递增
ser1.is_monotonic_decreasing -- 是否是单调递减
ser1.sort_vlaues() -- 按值升序排序
索引:(at, iat; loc, iloc)
单值查询:
ser1.at['一季度&