Pandas 中序列(Series)是能够保存任何类型的数据(整数，字符串，浮点数，Python对象等)的一维标记数组。轴标签统称为索引。这个概念与字典有点类似。

创建Pandas序列

Pandas 序列可以使用以下构造函数创建：

pandas.Series( data, index, dtype, copy)

构造函数的参数如下：

data 为来源数据，可以使用多种格式，如：ndarray，list，constants ；
index 必须是唯一的和散列的索引值，与数据的长度相同。如果没有索引被传递，缺省使用 np.arange(n) ；
dtype 用于数据类型。如果没有，会尝试推断数据类型；
copy 复制数据，默认为 false 。

可以使用各种 Python 中的序列来创建一个 Pandas 序列，如：

数组
字典
标量值或常数

如果没有参数会创建一个基本序列，则是一个空序列。

In [2]:

import pandas as pd
import numpy as np

In [3]:

s = pd.Series()
s

Out[3]:

Series([], dtype: object)

最好声明一下类型。

In [4]:

pd.Series(dtype= np.float64)

Out[4]:

Series([], dtype: float64)

从 `ndarray` 创建一个序列

如果数据是 ndarray ，则传递的索引必须具有相同的长度。如果没有传递索引值，那么默认的索引范围将是 np.arange(n) ，其中 n 是数组长度。

In [5]:

import numpy as np
data = np.array(['a','b','c','d'])
s = pd.Series(data)
s

Out[5]:

0    a
1    b
2    c
3    d
dtype: object

这里没有传递任何索引，因此默认情况下，它分配了从 0 到 len(data)-1 的索引，即： 0 - 3。

In [6]:

s2 = pd.Series(data,index=[100,101,102,103])
s2

Out[6]:

100    a
101    b
102    c
103    d
dtype: object

在这里传递了索引值。现在可以在输出中看到自定义的索引值。

从字典创建一个序列

字典(dict)可以作为输入传递，如果没有指定索引，则按排序顺序取得字典键以构造索引。如果传递了索引，索引中与标签对应的数据中的值将被拉出。

In [7]:

data = {'a' : 0., 'b' : 1., 'c' : 2.}
s = pd.Series(data)
s

Out[7]:

a    0.0
b    1.0
c    2.0
dtype: float64

注意：字典键用于构建索引。

In [8]:

# data = {'a' : 0., 'b' : 1., 'c' : 2.}
s = pd.Series(data,index=['b','c','d','a'])
s

Out[8]:

b    1.0
c    2.0
d    NaN
a    0.0
dtype: float64

注意观察：索引顺序保持不变，缺少的元素使用 NaN (不是数字)填充。

从标量创建一个序列

如果数据是标量值，则必须提供索引。将重复该值以匹配索引的长度。

In [9]:

s = pd.Series(5, index=[0, 1, 2, 3])
s

Out[9]:

0    5
1    5
2    5
3    5
dtype: int64

从具有位置的序列中访问数据

序列中的数据可以使用类似于访问 ndarray 中的数据来访问。

In [10]:

s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e'])

检索第一个元素。比如已经知道数组从零开始计数，第一个元素存储在零位置。

In [11]:

s[0]

/tmp/ipykernel_6695/243613605.py:1: FutureWarning: Series.__getitem__ treating keys as positions is deprecated. In a future version, integer keys will always be treated as labels (consistent with DataFrame behavior). To access a value by position, use `ser.iloc[pos]`
  s[0]

Out[11]:

np.int64(1)

检索序列中的前三个元素。如果 a: 被插入到其前面，则将从该索引向前的所有项目c。如果使用两个参数(使用它们之间)，则将从两个索引之间的项目(不包括停止索引)被提取。

In [12]:

s[:3]

Out[12]:

a    1
b    2
c    3
dtype: int64

检索最后三个元素，参考以下示例代码：

In [13]:

s[-3:]

Out[13]:

c    3
d    4
e    5
dtype: int64

使用标签检索数据(索引)

一个序列就像一个固定大小的字典，可以通过索引标签获取和设置值。

使用索引标签值检索单个元素。

In [14]:

s['a']

Out[14]:

np.int64(1)

使用索引标签值列表检索多个元素。

In [15]:

s[['a','c','d']]

Out[15]:

a    1
c    3
d    4
dtype: int64

如果请求不存在的标签，则会出现异常。

创建Pandas序列

从 `ndarray` 创建一个序列

从字典创建一个序列

从标量创建一个序列

从具有位置的序列中访问数据

使用标签检索数据(索引)

① 阅读使用手册

② 注册用户账号

介绍

平台内核

注意事项

创建Pandas序列

从 ndarray 创建一个序列

从字典创建一个序列

从标量创建一个序列

从具有位置的序列中访问数据

使用标签检索数据(索引)

① 阅读使用手册

② 注册用户账号

③ 登陆

Python基础

Python进阶

标准类库

专题工具

图像处理

科学计算

自然语言

开源GIS

R 编程语言

Julia编程语言

介绍

平台内核

注意事项

从 `ndarray` 创建一个序列