import pandas as pd

s = pd.Series(["a","b","c","a"], dtype="category")

print (s)

0    a
1    b
2    c
3    a
dtype: category
Categories (3, object): ['a', 'b', 'c']

import pandas as pd

cat = pd.Categorical(['a', 'b', 'c', 'a', 'b', 'c'])

print (cat)

['a', 'b', 'c', 'a', 'b', 'c']
Categories (3, object): ['a', 'b', 'c']

import pandas as pd

cat = cat=pd.Categorical(['a','b','c','a','b','c','d'], ['c', 'b', 'a'])

print (cat)

['a', 'b', 'c', 'a', 'b', 'c', NaN]
Categories (3, object): ['c', 'b', 'a']

import pandas as pd

cat = cat=pd.Categorical(['a','b','c','a','b','c','d'], ['c', 'b', 'a'],ordered=True)

print (cat)

['a', 'b', 'c', 'a', 'b', 'c', NaN]
Categories (3, object): ['c' < 'b' < 'a']

import pandas as pd
import numpy as np

cat = pd.Categorical(["a", "c", "c", np.nan], categories=["b", "a", "c"])

df = pd.DataFrame({"cat":cat, "s":["a", "c", "c", np.nan]})

print (df.describe())

       cat  s
count    3  3
unique   2  2
top      c  c
freq     2  2

print ("=============================")

=============================

print (df["cat"].describe())

count     3
unique    2
top       c
freq      2
Name: cat, dtype: object

import pandas as pd
import numpy as np

s = pd.Categorical(["a", "c", "c", np.nan], categories=["b", "a", "c"])

print (s.categories)

Index(['b', 'a', 'c'], dtype='object')

import pandas as pd
import numpy as np

cat = pd.Categorical(["a", "c", "c", np.nan], categories=["b", "a", "c"])

print (cat.ordered)

False

import pandas as pd

s = pd.Series(["a","b","c","a"], dtype="category")

s = s.cat.rename_categories({"a": "Group a", 
                            "b": "Group b", 
                            "c": "Group c"})

print(s.cat.categories)

Index(['Group a', 'Group b', 'Group c'], dtype='object')

import pandas as pd

s = pd.Series(["a","b","c","a"], dtype="category")

s = s.cat.add_categories([4])

print (s.cat.categories)

Index(['a', 'b', 'c', 4], dtype='object')

import pandas as pd

s = pd.Series(["a","b","c","a"], dtype="category")

print ("Original object:")

Original object:

s

0    a
1    b
2    c
3    a
dtype: category
Categories (3, object): ['a', 'b', 'c']

print ("After removal:")

After removal:

s.cat.remove_categories("a")

0    NaN
1      b
2      c
3    NaN
dtype: category
Categories (2, object): ['b', 'c']

import pandas as pd

cat = pd.Series(pd.Categorical([1,2,3], categories=[1,2,3], ordered=True))
cat1 = pd.Series(pd.Categorical([2,2,2], categories=[1,2,3], ordered=True))

print(cat > cat1)

0    False
1    False
2     True
dtype: bool

分类对象创建

category

pd.Categorical

Description

获取类别的属性

重命名类别

附加新类别

删除类别

分类数据的比较

① 阅读使用手册

② 注册用户账号

介绍

平台内核

注意事项

分类对象创建

category

pd.Categorical

Description

获取类别的属性

重命名类别

附加新类别

删除类别

分类数据的比较

① 阅读使用手册

② 注册用户账号

③ 登陆

Python基础

Python进阶

标准类库

专题工具

图像处理

科学计算

自然语言

开源GIS

R与Julia

介绍

平台内核

注意事项