-
把字符串离散化:
1)获取字符串的去重后列表
2)构造全为0的数组,columns为字符串的列表
3)给全为0的数组赋值,遍历 -
join:index相同的数据合并到一起
3 merge:按照指定的列把数据按照一定的方式合并到一起
4.分组聚合: -
1)df.groupby(by=“”) 得到group对象,能够用于聚合和遍历
-
2)df.groupby(by=“”).mean()
-
- df.groupby(by=“”).mean()
-
- df.groupby(by=[“”,“”]).count(): 带复合索引的DataFrame
5.索引:
- df.index()
- df.index=[“a”, “c”] 设定索引的值
- df.set_index(“a”) 设定某一列为索引
- df.set_index([“a”,“c”]) 设定某两列为索引
- 从复合索引中取值:
Series: s1[“a”][“b”] 或者 s1[“a”,“b”]
DataFrame: df.loc[“a”].loc[“b”] - 从里层索引开始选择:df.swaplevel() 交换里外层索引的位置