目录

搜索

输入搜索字词或模块,类或函数名称。

pandas.core.groupby.DataFrameGroupBy.describe

DataFrameGroupBy.describe(percentiles=None, include=None, exclude=None)

生成各种汇总统计,不包括NaN值。

参数:

百分位数:array-like,可选

要包括在输出中的百分位数。应该都在区间[0,1]。默认情况下,百分位数为[.25,.5,.75],返回第25,50和75百分位数。

include,exclude:list-like,'all'或None(默认值)

指定返回结果的形式。或者:

  • 无对两者(默认)。结果将只包括数字类型的列,如果没有,则只包括分类列。
  • 要包括/排除的dtypes或字符串的列表。要选择所有数字类型,请使用numpy numpy.number。要选择类别对象,请使用类型对象。另请参见select_dtypes文档。例如。df.describe(include = ['O'])
  • 如果include是字符串“all”,则输出列集合将匹配输入列集合。
返回:

摘要:NDFrame的摘要统计

也可以看看

DataFrame.select_dtypes

笔记

输出DataFrame索引取决于请求的Dtypes:

对于数字类型,它将包括:count,mean,std,min,max和lower,50和上百分位数。

对于对象类型(例如,时间戳或字符串),索引将包括最常见的计数,唯一,最常见和频率。时间戳还包括第一个和最后一个项目。

对于混合的Dtypes,索引将是相应输出类型的并集。不适用的条目将填充NaN。注意,mixed-dtype输出只能从混合dtype输入和适当使用include / exclude参数返回。

如果多个值具有最高计数,则将从具有最高计数的那些中任意选择计数最常见

对于Series,忽略include,exclude参数。

Scroll To Top