Pandas的排序 - 立方智算

Pandas的排序

发布时间： 2025年5月

标签：

开通会员可在线运行

内容目录按标签排序排序顺序按列排列按值排序

Pandas有两种排序方式，它们分别是：

按标签
按实际值

下面来看看一个输出的例子。

In [2]:

import pandas as pd
import numpy as np

In [3]:

unsorted_df=pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],columns=['col2','col1'])
unsorted_df

Out[3]:

	col2	col1
1	1.277949	2.206393
4	-2.278937	0.275532
6	0.194783	0.368292
2	0.034584	0.099397
3	0.492007	-0.104609
5	2.238045	-0.015054
9	0.030045	0.061799
8	-0.148092	0.761345
0	-1.448595	0.886345
7	-1.007094	0.029695

在 unsorted_df 数据值中，标签和值未排序。下面来看看如何按标签来排序。

按标签排序

使用 sort_index() 方法，通过传递 axis 参数和排序顺序，可以对DataFrame进行排序。默认情况下，按照升序对行标签进行排序。

In [4]:

unsorted_df.sort_index()

Out[4]:

	col2	col1
0	-1.448595	0.886345
1	1.277949	2.206393
2	0.034584	0.099397
3	0.492007	-0.104609
4	-2.278937	0.275532
5	2.238045	-0.015054
6	0.194783	0.368292
7	-1.007094	0.029695
8	-0.148092	0.761345
9	0.030045	0.061799

排序顺序

通过将布尔值传递给升序参数，可以控制排序顺序。通过下面的例子来理解一下。

In [5]:

unsorted_df.sort_index(ascending=False)

Out[5]:

	col2	col1
9	0.030045	0.061799
8	-0.148092	0.761345
7	-1.007094	0.029695
6	0.194783	0.368292
5	2.238045	-0.015054
4	-2.278937	0.275532
3	0.492007	-0.104609
2	0.034584	0.099397
1	1.277949	2.206393
0	-1.448595	0.886345

按列排列

通过传递 axis 参数值为0或1，可以对列标签进行排序。默认情况下， axis = 0 ，逐行排列。通过下面的例子来理解这个概念。

In [6]:

unsorted_df.sort_index(axis=1)

Out[6]:

	col1	col2
1	2.206393	1.277949
4	0.275532	-2.278937
6	0.368292	0.194783
2	0.099397	0.034584
3	-0.104609	0.492007
5	-0.015054	2.238045
9	0.061799	0.030045
8	0.761345	-0.148092
0	0.886345	-1.448595
7	0.029695	-1.007094

按值排序

像索引排序一样，sort_values() 是采用按值排序的方法。它接受一个 by 参数，它将使用要与其排序值的DataFrame的列名称。

In [7]:

unsorted_df = pd.DataFrame({'col1':[2,1,1,1],'col2':[1,3,2,4]})
unsorted_df.sort_values(by='col1')

Out[7]:

	col1	col2
1	1	3
2	1	2
3	1	4
0	2	1

注意：观察上面的输出结果，col1 值被排序，相应的 col2 值和行索引将随 col1 一起改变。因此，它们看起来没有排序。

通过 by 参数指定需要列值，参考以下示例代码：

In [8]:

unsorted_df.sort_values(by=['col1','col2'])

Out[8]:

	col1	col2
2	1	2
1	1	3
3	1	4
0	2	1

排序算法

sort_values() 提供了从 mergeesort ， heapsort 和 quicksort 中选择算法的一个配置。Mergesort 是唯一稳定的算法。参考以下示例代码：

In [9]:

unsorted_df.sort_values(by='col1' ,kind='mergesort')

Out[9]:

	col1	col2
1	1	3
2	1	2
3	1	4
0	2	1

本文链接： Pandas的排序

上一篇： Pandas的迭代下一篇：Pandas字符串和文本数据

① 阅读使用手册

平台的登录与使用，请参考《用户使用手册》

② 注册用户账号

若尚未开通科学计算平台使用权限，请注册用户账号

③ 登陆

第三方账号登录

1 R 语言基础
2 R 语言中的数据

1 简明Julia

介绍

为了方便学习Python语言，基于Jupyter技术栈搭建了在线计算环境。用户使用时以网页形式打开，对照书中内容进行学习，在线编写代码和运行代码，代码的运行结果也会直接显示。如在编程过程中需要编写说明文档，可在同一个页面直接编写，便于作及时的说明和解释。

在数据科学、机器学习及深度学习的领域里，Jupyter是一个强大的工具，它集成了代码编写、可视化展示、文档记录等多种功能于一体，让科学计算变得既直观又高效。随着数据科学和人工智能领域的不断发展，Jupyter 也在不断更新和完善其功能和性能。未来可以期待看到更多创新的特性和工具被加入到 Jupyter 中，从而进一步推动科学计算和数据分析的发展。

平台内核

目前平台提供配置好的计算时内核供运行使用。后期会根据需求增加公用内核及内核中的默认类库。相关语言运行环境与类库一般由 Conda 库提供最新版本。

Python 3.11 [系统]
Python 3.12 [Conda]
R 4.4 [Conda]

注意事项

平台使用Jupyter技术搭建，登陆认证使用本系统的注册账号。
使用提供一定数量的硬盘空间存储供用户使用。目前限制为 500M 。

Copyright © 立方智算 Since 2025. 工信部ICP备案：吉ICP备2025024314号