pandas.qcut

pandas.qcut(x, q, labels=None, retbins=False, precision=3)[source]

基于分位数的离散化函数。基于秩或基于样本分位数将变量离散化为等大小桶。例如,10个分位数的1000个值将产生指示每个数据点的分位数成员资格的分类对象。

参数:

x:ndarray或Series

q:整数或分位数阵列

分位数。十分位数为10,四分位数为4或者,分位数阵列,例如[0,.25,.5,.75,1.]四分位数

标签:array或boolean,默认值为无

用作生成的仓的标签。必须与生成的仓的长度相同。如果为False,则只返回bin的整数指示符。

retbins:bool,可选

是否返回bin。如果bin作为标量给出,则可能有用。

precision:int

存储和显示容器标签的精度

返回:

out:分类或系列或整数数组(如果标签为False)

返回类型(分类或系列)取决于输入:a系列类型类型,如果输入是一个系列其他分类。返回分类数据时,分档表示为类别。

货仓:ndarray的浮点数

仅在retbins为True时返回。

笔记

在结果分类对象中的超出值将为NA

例子

>>> pd.qcut(range(5), 4)
[[0, 1], [0, 1], (1, 2], (2, 3], (3, 4]]
Categories (4, object): [[0, 1] < (1, 2] < (2, 3] < (3, 4]]
>>> pd.qcut(range(5), 3, labels=["good","medium","bad"])
[good, good, medium, bad, bad]
Categories (3, object): [good < medium < bad]
>>> pd.qcut(range(5), 4, labels=False)
array([0, 0, 1, 2, 3], dtype=int64)
Scroll To Top