pandas.Series.groupby

Series.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, **kwargs)[source]

使用mapper的组系列(dict或key函数,将给定函数应用于组,将结果返回为系列)或通过一系列列。

参数:

by:映射函数/函数列表,dict,Series或tuple /

列名列表。在对象索引的每个元素上调用以确定组。如果传递了dict或Series,那么将使用Series或dict VALUES来确定组

axis:int,default 0

level:int,级别名称或序列,默认值为None

如果轴是MultiIndex(分层),则按特定级别分组

as_index:boolean,default True

对于聚合输出,返回具有组标签作为索引的对象。仅与DataFrame输入相关。as_index = False实际上是“SQL风格”的分组输出

sort:boolean,default True

排序组键。关闭此功能可获得更好的性能。注意这不影响每个组内观察的顺序。groupby保留每个组中的行的顺序。

group_keys:boolean,default True

当调用apply时,添加组键以索引以标识片段

squeeze:boolean,default False

如果可能,减小返回类型的维数,否则返回一致的类型

返回:

GroupBy对象

例子

DataFrame结果

>>> data.groupby(func, axis=0).mean()
>>> data.groupby(['col1', 'col2'])['col3'].mean()

带有层次索引的DataFrame

>>> data.groupby(['col1', 'col2']).mean()
Scroll To Top