pandas.Categorical¶
- class
pandas.
Categorical
(values, categories=None, ordered=False, name=None, fastpath=False)[source]¶ 表示经典R / S加方式的分类变量
分类只能接受有限的(通常为固定)数量的可能值(类别)。与统计分类变量相反,分类可能有一个顺序,但是数值操作(加法,除法,...)是不可能的。
分类的所有值都位于类别或np.nan中。分配类别以外的值将产生ValueError。顺序由类别的顺序定义,而不是值的词汇顺序。
参数: 值:list-like
分类的值。如果给定类别,则不在类别中的值将替换为NaN。
类别:索引式(唯一),可选
此分类的唯一类别。如果未给出,则假定类别是值的唯一值。
有序:boolean,(default False)
此分类是否被视为有序分类。如果未给出,则生成的分类将不进行排序。
上升: ValueError
如果类别不验证。
TypeError
如果给定了显式的
ordered=True
,但没有类别和值不可排序。例子
>>> from pandas import Categorical >>> Categorical([1, 2, 3, 1, 2, 3]) [1, 2, 3, 1, 2, 3] Categories (3, int64): [1 < 2 < 3]
>>> Categorical(['a', 'b', 'c', 'a', 'b', 'c']) [a, b, c, a, b, c] Categories (3, object): [a < b < c]
>>> a = Categorical(['a','b','c','a','b','c'], ['c', 'b', 'a'], ordered=True) >>> a.min() 'c'