pandas.Series.groupby¶
-
Series.
groupby
(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, **kwargs)[source]¶ 使用mapper的组系列(dict或key函数,将给定函数应用于组,将结果返回为系列)或通过一系列列。
参数: by:映射函数/函数列表,dict,Series或tuple /
列名列表。在对象索引的每个元素上调用以确定组。如果传递了dict或Series,那么将使用Series或dict VALUES来确定组
axis:int,default 0
level:int,级别名称或序列,默认值为None
如果轴是MultiIndex(分层),则按特定级别分组
as_index:boolean,default True
对于聚合输出,返回具有组标签作为索引的对象。仅与DataFrame输入相关。as_index = False实际上是“SQL风格”的分组输出
sort:boolean,default True
排序组键。关闭此功能可获得更好的性能。注意这不影响每个组内观察的顺序。groupby保留每个组中的行的顺序。
group_keys:boolean,default True
当调用apply时,添加组键以索引以标识片段
squeeze:boolean,default False
如果可能,减小返回类型的维数,否则返回一致的类型
返回: GroupBy对象
例子
DataFrame结果
>>> data.groupby(func, axis=0).mean() >>> data.groupby(['col1', 'col2'])['col3'].mean()
带有层次索引的DataFrame
>>> data.groupby(['col1', 'col2']).mean()