1.groupby机制
第一步,数据包含在pandas对象中,可以是Series、DataFrame或其他数据结构
第二步,根据你提供的一个或多个键分离到各个组中注:分离操作是在数据对象的特定轴向上进行的。
第三步,函数就应用到各个组中,产生新的值
第四步,所有函数的应用结果联合为一个结果对象
2.分组键可是多种形式,并且键不一定是完全相同的类型
(1)与需要分组的轴向长度一致的值列表或值数组
(2) DataFrame的列名的值
(3)可以将分组轴向上的值和分组名称相匹配的字典或Series
(4) 可以在轴索引或索引中的单个标签上调用的函数
注:后三种方法是可以产生用于分隔对象的值数组的快捷方式
import numpy as np
import pandas as pd
'''载入data文件中的:train-left-up.csv'''
text = pd