Pandas数据分析工具
1
Pandas分组(GroupBy)

任何分组(groupby)操作都涉及原始对象的以下操作之一。它们是: 分割对象 应用一个函数 结合的结果 在许多情况下,将数据分成多个集合,并在每个子集上应用一些函数。在应用函数中,可以执行以下操作: 聚合 - 计算汇总统计量 ...

2025-08-31

2
Pandas合并/连接

Pandas 具有全功能、高性能的内存中连接操作,在惯用上与 SQL 等关系数据库非常相似。 Pandas 提供了一个单独的 merge() 函数,作为DataFrame对象之间所有标准数据库连接操作的入口。 pd.merge(lef...

2025-08-31

3
Pandas串联

Pandas提供了各种工具(功能),可以轻松地将Series,DataFrame和Panel对象组合在一起。 pd.concat(objs,axis=0,join='outer',join_axes=None, ign...

2025-08-31

4
Pandas日期功能

日期功能扩展了时间序列,在财务数据分析中起主要作用。在处理日期数据的同时,我们经常会遇到以下情况: 生成日期序列 将日期序列转换为不同的频率 创建一个日期范围 通过指定周期和频率,使用 date.range() 函数就可以创建日期...

2025-08-31

5
Pandas时间差(Timedelta)

时间差(Timedelta)是时间上的差异,以不同的单位来表示。例如:日,小时,分钟,秒。 它们可以是正值,也可以是负值。 可以使用各种参数创建 Timedelta 对象,如下所示: 字符串 通过传递字符串,可以创建一个 timede...

2025-08-31

6
Pandas分类数据

通常实时的数据包括重复的文本列。例如:性别,国家和代码等特征总是重复的。 这些是分类数据的例子。 分类变量只能采用有限且通常是固定的数量。除了固定长度, 分类数据可能有顺序,但不能执行数字操作。 分类是Pandas数据类型。 分类数据...

2025-08-31

7
Pandas可视化

Pandas 提供了基于 Matplotlib 的集成可视化功能,允许用户通过简单的 .plot() 方法快速绘制各种图表, 适用于数据探索、趋势分析和结果展示。 基本绘图:plot Series和DataFrame上的绘图功能是对 ...

2025-08-31

8
Pandas IO工具

Pandas I/O API是一套像 pd.read_csv() 一样返回 Pandas 对象的顶级读取器函数。 读取文本文件(或平面文件)的两个主要功能是 read_csv() 和 read_table() 。 它们都使用相同的解析...

2025-08-31

9
Pandas稀疏数据

当任何匹配特定值的数据(NaN/缺失值,尽管可以选择任何值)被省略时,稀疏对象被“压缩”。 一个特殊的 SparseIndex 对象跟踪数据被“稀疏”的地方。 这将在一个例子中更有意义。 在旧版本中,所有的标准Pandas数据结构都应...

2025-08-31

10
Pandas注意事项和窍门

Pandas中已知警告和隐蔽陷阱是需要特别注意的地方。 与Pandas一起使用If/Truth语句 当尝试将某些东西转换成布尔值时,Pandas遵循了一个错误的惯例。 这种情况发生在使用布尔运算的。 目前还不清楚结果是什么。 如果它是...

2025-08-31

11
Pandas与SQL比较

由于许多潜在的Pandas用户对SQL有一定的了解,因此本文章旨在提供一些如何使用Pandas执行各种SQL操作的示例。 文件:tips.csv total_bill,tip,sex,smoker,day,time,size 0,16...

2025-08-31

12
使用Pandas处理大型CSV文件

CSV (Comma Separated Values)作为一种逗号分隔型值的纯文本格式文件,在实际应 用中经常用到, 如数据库数据的导入导出、数据分析中记录的存储等,因此很多语言都提供了对CSV文件处理的模块, Python也不例外...

2025-08-31

阅读使用手册


平台的登录与使用,请参考 《用户使用手册》


注册用户账号


若尚未开通科学计算平台使用权限,请 注册用户账号


登陆


第三方账号登录




介绍

为了方便学习Python语言,基于Jupyter技术栈搭建了在线计算环境。 用户使用时以网页形式打开,对照书中内容进行学习,在线编写代码和运行代码,代码的运行结果也会直接显示。如在编程过程中需要编写说明文档,可在同一个页面直接编写,便于作及时的说明和解释。

在数据科学、机器学习及深度学习的领域里,Jupyter是一个强大的工具,它集成了代码编写、可视化展示、文档记录等多种功能于一体,让科学计算变得既直观又高效。 随着数据科学和人工智能领域的不断发展,Jupyter 也在不断更新和完善其功能和性 能。 未来可以期待看到更多创新的特性和工具被加入到 Jupyter 中,从而进一步推动科学计算和数据分析的发展。





平台内核

目前平台提供配置好的计算时内核供运行使用。后期会根据需求增加公用内核及内核中的默认类库。 相关语言运行环境与类库一般由 Conda 库提供最新版本。

  • Python 3.11 [系统]
  • Python 3.12 [Conda]
  • R 4.4 [Conda]


注意事项

  • 平台使用Jupyter技术搭建,登陆认证使用本系统的注册账号。
  • 使用提供一定数量的硬盘空间存储供用户使用。目前限制为 500M 。
Copyright © 立方智算 Since 2025. 工信部ICP备案:吉ICP备2025024314号