Pandas数据分析工具
1
Pandas快速入门

Pandas快速入门教程,主要面向新用户。 主要是为那些喜欢“短平快”的读者准备的, 有兴趣的读者可通过教程来一步一步地学习应用知识。 首先,假设安装 Pandas。 测试工作环境是否有安装好了 Pandas ,导入相关包如下: 注意...

2025-05-9

2
Pandas 中的序列(Series)

Pandas 中序列(Series)是能够保存任何类型的数据(整数,字符串,浮点数,Python对象等)的一维标记数组。 轴标签统称为索引。这个概念与字典有点类似。 创建Pandas序列 Pandas 序列可以使用以下构造函数创建: ...

2025-05-27

3
Pandas中的数据帧(DataFrame)

Pandas中数据帧(DataFrame)是二维数据结构,即数据以行和列的表格方式排列。 可以视为 SQL 表或电子表格数据表示。 数据帧(DataFrame)的功能特点: 潜在的列是不同的类型 大小可变 标记轴(行和列) 可以对行...

2025-05-9

4
Pandas基本功能

到目前为止,我们了解了三种Pandas数据结构以及如何创建它们。我们将主要关注数据帧(DataFrame)对象,因为它在实时数据处理中非常重要,并讨论其他数据结构。 系列基本功能 编号 属性或方法 描述 1 axes 返...

2025-05-28

5
Pandas描述性统计

有很多方法用来集体计算DataFrame的描述性统计信息和其他相关操作。 其中大多数是 sum() , mean() 等聚合函数,但其中一些,如 sumsum() ,产生一个相同大小的对象。 一般来说,这些方法采用轴参数,就像 nda...

2025-05-6

6
Pandas函数应用

将自定义或其他库的函数应用于Pandas对象,包括三个重要的方法,下面来讨论如何使用这些方法。 使用适当的方法取决于函数是否期望在整个DataFrame的行或列或元素上进行操作。 表合理函数应用:pipe() 行或列函数应用:app...

2025-05-28

7
Pandas重建索引

重新索引会更改DataFrame的行标签和列标签。重新索引意味着符合数据以匹配特定轴上的一组给定的标签。 可以通过索引来实现多个操作: 重新排序现有数据以匹配一组新的标签。 在没有标签数据的标签位置插入缺失值( NA )标记。 示...

2025-05-28

8
Pandas的迭代

Pandas对象之间的基本迭代的行为取决于类型。当迭代一个系列时,它被视为数组式,基本迭代产生这些值。 其他数据结构,如:DataFrame和Panel,遵循类似惯例迭代对象的键。 简而言之,基本迭代(对于在对象中)产生: Seri...

2025-05-9

9
Pandas的排序

Pandas有两种排序方式,它们分别是: 按标签 按实际值 下面来看看一个输出的例子。 在 unsorted_df 数据值中,标签和值未排序。下面来看看如何按标签来排序。 按标签排序 使用 sort_index() 方法,通过传递...

2025-05-9

10
Pandas字符串和文本数据

在本章中,我们将使用基本系列/索引来学习字符串操作。 在随后的章节中,将学习如何将这些字符串函数应用于数据帧(DataFrame)。 Pandas提供了一组字符串函数,可以方便地对字符串数据进行操作。 最重要的是,这些函数忽略(或排除...

2025-05-9

11
Pandas选项和自定义

Pandas提供API来自定义其行为的某些方面,大多是用来显示。 API由五个相关函数组成。它们分别是: get_option() set_option() reset_option() describe_option() opti...

2025-05-28

12
Pandas索引和选择数据

除了基于纯标签和整数之外,Pandas还提供了一种使用运算符进行选择和子集化对象的混合方法。 可以使用 loc() 函数或 iloc() 函数。 在旧版本中使用的是 ix ,现在已经被弃用。 loc 从索引中获取具有特定标签的行(或...

2025-05-28

13
Pandas统计函数

统计方法有助于理解和分析数据的行为。 现在将学习一些统计函数,可以将这些函数应用到 Pandas 的对象上。 百分比变化 系列,DatFrames和Panel都有 pct_change() 函数。 此函数将每个元素与其前一个元素进行比...

2025-05-28

14
Pandas窗口函数

为了处理数字数据,Pandas提供了几个变体,如滚动,展开和指数移动窗口统计的权重。 其中包括总和,均值,中位数,方差,协方差,相关性等。 下面来学习如何在DataFrame对象上应用上上面提及的每种方法。 .rolling() 函数...

2025-05-9

15
Pandas聚合

Pandas 聚合操作是数据分析的核心功能,它通过简洁高效的接口实现数据的统计计算和特征提取。 创建滚动、扩展和 ewm 对象后,可以使用多种方法对数据执行聚合。 三种时间窗口聚合器: 滚动窗口(rolling):固定窗口大小的移动...

2025-05-9

16
Pandas缺失数据

在现实生活场景中,丢失数据始终是一个问题。 由于缺失值导致数据质量不佳,机器学习和数据挖掘等领域在模型预测的准确性方面面临严重问题。 在这些领域,缺失值处理是使模型更加准确和有效的重点。 想象一下有一个产品的在线调查。很多时候,人们不...

2025-05-9

17
Pandas分组(GroupBy)

任何分组(groupby)操作都涉及原始对象的以下操作之一。它们是: 分割对象 应用一个函数 结合的结果 在许多情况下,将数据分成多个集合,并在每个子集上应用一些函数。在应用函数中,可以执行以下操作: 聚合 - 计算汇总统计量 ...

2025-05-9

18
Pandas合并/连接

Pandas 具有全功能、高性能的内存中连接操作,在惯用上与 SQL 等关系数据库非常相似。 Pandas 提供了一个单独的 merge() 函数,作为DataFrame对象之间所有标准数据库连接操作的入口。 pd.merge(lef...

2025-05-9

19
Pandas串联

Pandas提供了各种工具(功能),可以轻松地将Series,DataFrame和Panel对象组合在一起。 pd.concat(objs,axis=0,join='outer',join_axes=None, ign...

2025-05-9

20
Pandas日期功能

日期功能扩展了时间序列,在财务数据分析中起主要作用。在处理日期数据的同时,我们经常会遇到以下情况: 生成日期序列 将日期序列转换为不同的频率 创建一个日期范围 通过指定周期和频率,使用 date.range() 函数就可以创建日期...

2025-05-9

阅读使用手册


平台的登录与使用,请参考 《用户使用手册》


注册用户账号


若尚未开通科学计算平台使用权限,请 注册用户账号


登陆


第三方账号登录




介绍

为了方便学习Python语言,基于Jupyter技术栈搭建了在线计算环境。 用户使用时以网页形式打开,对照书中内容进行学习,在线编写代码和运行代码,代码的运行结果也会直接显示。如在编程过程中需要编写说明文档,可在同一个页面直接编写,便于作及时的说明和解释。

在数据科学、机器学习及深度学习的领域里,Jupyter是一个强大的工具,它集成了代码编写、可视化展示、文档记录等多种功能于一体,让科学计算变得既直观又高效。 随着数据科学和人工智能领域的不断发展,Jupyter 也在不断更新和完善其功能和性 能。 未来可以期待看到更多创新的特性和工具被加入到 Jupyter 中,从而进一步推动科学计算和数据分析的发展。





平台内核

目前平台提供配置好的计算时内核供运行使用。后期会根据需求增加公用内核及内核中的默认类库。 相关语言运行环境与类库一般由 Conda 库提供最新版本。

  • Python 3.11 [系统]
  • Python 3.12 [Conda]
  • R 4.4 [Conda]


注意事项

  • 平台使用Jupyter技术搭建,登陆认证使用本系统的注册账号。
  • 使用提供一定数量的硬盘空间存储供用户使用。目前限制为 500M 。
Copyright © 立方智算 Since 2025. 工信部ICP备案:吉ICP备2025024314号