pandas.qcut¶
-
pandas.
qcut
(x, q, labels=None, retbins=False, precision=3)[source]¶ 基于分位数的离散化函数。基于秩或基于样本分位数将变量离散化为等大小桶。例如,10个分位数的1000个值将产生指示每个数据点的分位数成员资格的分类对象。
参数: x:ndarray或Series
q:整数或分位数阵列
分位数。十分位数为10,四分位数为4或者,分位数阵列,例如[0,.25,.5,.75,1.]四分位数
标签:array或boolean,默认值为无
用作生成的仓的标签。必须与生成的仓的长度相同。如果为False,则只返回bin的整数指示符。
retbins:bool,可选
是否返回bin。如果bin作为标量给出,则可能有用。
precision:int
存储和显示容器标签的精度
返回: out:分类或系列或整数数组(如果标签为False)
返回类型(分类或系列)取决于输入:a系列类型类型,如果输入是一个系列其他分类。返回分类数据时,分档表示为类别。
货仓:ndarray的浮点数
仅在retbins为True时返回。
笔记
在结果分类对象中的超出值将为NA
例子
>>> pd.qcut(range(5), 4) [[0, 1], [0, 1], (1, 2], (2, 3], (3, 4]] Categories (4, object): [[0, 1] < (1, 2] < (2, 3] < (3, 4]] >>> pd.qcut(range(5), 3, labels=["good","medium","bad"]) [good, good, medium, bad, bad] Categories (3, object): [good < medium < bad] >>> pd.qcut(range(5), 4, labels=False) array([0, 0, 1, 2, 3], dtype=int64)