Pandas模块
- DataFrame
- DataFrame的级联操作
- pd.concat()
- 类似于np.concatenate函数,多了一些参数:objs,axis,keys,join,ignore_index。
- 不匹配级联,指级联的维度的索引不一致,有两种连接方式:
- 外连接:补NaN,默认模式
- 内连接:只连接匹配的项
- 合并操作
- pd.merge()
- 级联是对表格的拼接,合并是对数据做合并。merge需要根据某一共同的列进行合并,会自动根据两者名称相同的column那一列来合并。若是两张表没有名称相同的列时,可使用left_on和right_on来指定列作为合并的列。
- 内合并与外合并,out取并集,inner取交集。
- DataFrame的级联操作
- pandas高级操作
- 替换操作replace()
- 单值替换,替换所有符合要求的元素:to_replace=x,value=y
- 按列指定数据加载单值替换:to_replace={列标签:替换值},value=y;
- 多值替换
- 列表替换:to_replace=[],value=[]
- 字典替换:to_replace={to_replace:value,to_replace:value}
- 映射操作,给一个元素值提
- 替换操作replace()