到目前为止，我们了解了三种Pandas数据结构以及如何创建它们。我们将主要关注数据帧(DataFrame)对象，因为它在实时数据处理中非常重要，并讨论其他数据结构。

系列基本功能

编号	属性或方法	描述
1	`axes`	返回行轴标签列表。
2	`dtype`	返回对象的数据类型(`dtype`)。
3	`empty`	如果系列为空，则返回`True`。
4	`ndim`	返回底层数据的维数，默认定义：`1`。
5	`size`	返回基础数据中的元素数。
6	`values`	将系列作为`ndarray`返回。
7	`head()`	返回前`n`行。
8	`tail()`	返回最后`n`行。

现在创建一个系列并演示如何使用上面所有列出的属性操作。

In [2]:

import pandas as pd
import numpy as np

创建一个包含100个随机数的 Series

In [3]:

s = pd.Series(np.random.randn(4))
print(s)

0    1.549542
1   -0.135235
2   -0.471869
3   -0.050726
dtype: float64

axes示例

返回系列的标签列表。参考以下示例代码：

In [4]:

import pandas as pd
import numpy as np

创建一个包含100个随机数的 Series

In [5]:

s = pd.Series(np.random.randn(4))
print ("The axes are:")

The axes are:

In [6]:

print(s.axes)

[RangeIndex(start=0, stop=4, step=1)]

上述结果是从0到5的值列表的紧凑格式，即：[0,1,2,3,4] 。

empty示例

返回布尔值，表示对象是否为空。返回 True 则表示对象为空。

作为示例，创建100个随机数字的序列：

In [7]:

s = pd.Series(np.random.randn(4))
print("Is the Object empty?", s.empty)

Is the Object empty? False

ndim示例

返回对象的维数。根据定义，一个系列是一个1D数据结构，参考以下示例代码

创建一个包含4个随机数的 Serie

In [8]:

s = pd.Series(np.random.randn(4))
print(s)

0   -1.688740
1   -0.427721
2    0.685258
3   -0.192390
dtype: float64

In [9]:

print("The dimensions of the object:", s.ndim)

The dimensions of the object: 1

size示例

返回系列的大小(长度)。参考以下示例代码：

创建一个包含2个随机数的 Series

In [10]:

s = pd.Series(np.random.randn(2))
print(s)

0   -1.052340
1    0.528544
dtype: float64

In [11]:

print("The size of the object:", s.size)

The size of the object: 2

values示例

以数组形式返回系列中的实际数据值。

创建一个包含4个随机数的 Series

In [12]:

s = pd.Series(np.random.randn(4))
print(s)

0    0.390511
1   -0.933345
2   -0.604551
3    0.039096
dtype: float64

In [13]:

print("The actual data series is:", s.values)

The actual data series is: [ 0.39051077 -0.93334486 -0.60455064  0.03909632]

`head()` 和 `tail()` 方法示例

要查看 Series 或 DataFrame 对象的小样本，请使用 head() 和 tail() 方法。

head() 返回前 n 行(观察索引值)。要显示的元素的默认数量为5，但可以传递自定义这个数字值。

创建一个包含4个随机数的序列

In [14]:

s = pd.Series(np.random.randn(4))
print("The original series is:")

The original series is:

In [15]:

print(s)

0    0.874249
1    0.275182
2    0.661165
3   -1.070576
dtype: float64

In [16]:

print("The first two rows of the data series:")

The first two rows of the data series:

In [17]:

print(s.head(2))

0    0.874249
1    0.275182
dtype: float64

tail() 返回最后n行(观察索引值)。要显示的元素的默认数量为 5 ，但可以传递自定义数字值。参考以下示例代码：

创建一个包含4个随机数的 Series 。

In [18]:

s = pd.Series(np.random.randn(4))
print("The original series is:")

The original series is:

In [19]:

print(s)

0    0.243765
1   -0.323074
2    0.238040
3    0.082338
dtype: float64

In [20]:

print("The last two rows of the data series:")

The last two rows of the data series:

In [21]:

print(s.tail(2))

2    0.238040
3    0.082338
dtype: float64

执行上面示例代码，得到上面打印的结果。

DataFrame基本功能

下面来看看数据帧(DataFrame)的基本功能有哪些？下表列出了DataFrame基本功能的重要属性或方法。

编号	属性或方法	描述
1	`T`	转置行和列。
2	`axes`	返回一个列，行轴标签和列轴标签作为唯一的成员。
3	`dtypes`	返回此对象中的数据类型(`dtypes`)。
4	`empty`	如果`NDFrame`完全为空[无项目]，则返回为`True`; 如果任何轴的长度为`0`。
5	`ndim`	轴/数组维度大小。
6	`shape`	返回表示`DataFrame`的维度的元组。
7	`size`	`NDFrame`中的元素数。
8	`values`	NDFrame的Numpy表示。
9	`head()`	返回开头前`n`行。
10	`tail()`	返回最后`n`行。

下面来看看如何创建一个DataFrame并使用上述属性和方法。

创建一个由 Series 组成的字典：

In [22]:

d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}

创建一个DataFrame（数据帧）：

In [23]:

df = pd.DataFrame(d)
print("Our data series is:")

Our data series is:

In [24]:

print(df)

    Name  Age  Rating
0    Tom   25    4.23
1  James   26    3.24
2  Ricky   25    3.98
3    Vin   23    2.56
4  Steve   30    3.20
5  Minsu   29    4.60
6   Jack   23    3.80

T(转置)示例

返回DataFrame的转置，行和列将交换。参考以下示例代码：

In [25]:

import pandas as pd
import numpy as np

创建一个由 Series 组成的字典

In [26]:

d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}

创建一个DataFrame（数据帧）：

In [27]:

df = pd.DataFrame(d)
print ("The transpose of the data series is:")

The transpose of the data series is:

In [28]:

print (df.T)

           0      1      2     3      4      5     6
Name     Tom  James  Ricky   Vin  Steve  Minsu  Jack
Age       25     26     25    23     30     29    23
Rating  4.23   3.24   3.98  2.56    3.2    4.6   3.8

axes示例

返回行轴标签和列轴标签列表。参考以下示例代码：

In [29]:

import pandas as pd
import numpy as np

创建一个由 Series 构成的字典

In [30]:

d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}

创建一个DataFrame（数据帧）：

In [31]:

df = pd.DataFrame(d)
print ("Row axis labels and column axis labels are:")

Row axis labels and column axis labels are:

In [32]:

print( df.axes)

[RangeIndex(start=0, stop=7, step=1), Index(['Name', 'Age', 'Rating'], dtype='object')]

dtypes示例

返回每列的数据类型。参考以下示例代码：

In [33]:

import pandas as pd
import numpy as np

创建一个由 Series 构成的字典

In [34]:

d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}

创建一个DataFrame（数据帧）：

In [35]:

df = pd.DataFrame(d)
print("The data types of each column are:")

The data types of each column are:

In [36]:

print(df.dtypes)

Name       object
Age         int64
Rating    float64
dtype: object

empty示例

返回布尔值，表示对象是否为空；返回 True 表示对象为空。

In [37]:

import pandas as pd
import numpy as np

创建一个由 Series 构成的字典

In [38]:

d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}

创建一个DataFrame（数据帧）：

In [39]:

df = pd.DataFrame(d)
print ("Is the object empty?")

Is the object empty?

In [40]:

print( df.empty)

False

ndim示例

返回对象的维数。根据定义，DataFrame是一个2D对象。参考以下示例代码：

In [41]:

import pandas as pd
import numpy as np

创建一个由 Series 构成的字典

In [42]:

d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}

创建一个DataFrame（数据帧）：

In [43]:

df = pd.DataFrame(d)
print ("Our object is:")

Our object is:

In [44]:

print (df)

    Name  Age  Rating
0    Tom   25    4.23
1  James   26    3.24
2  Ricky   25    3.98
3    Vin   23    2.56
4  Steve   30    3.20
5  Minsu   29    4.60
6   Jack   23    3.80

In [45]:

print ("The dimension of the object is:")

The dimension of the object is:

In [46]:

print (df.ndim)

shape示例

返回表示DataFrame的维度的元组。元组(a，b)，其中a表示行数，b表示列数。

In [47]:

import pandas as pd
import numpy as np

创建一个由 Series 构成的字典

In [48]:

d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}

创建一个DataFrame（数据帧）：

In [49]:

df = pd.DataFrame(d)
print ("Our object is:")

Our object is:

In [50]:

print (df)

    Name  Age  Rating
0    Tom   25    4.23
1  James   26    3.24
2  Ricky   25    3.98
3    Vin   23    2.56
4  Steve   30    3.20
5  Minsu   29    4.60
6   Jack   23    3.80

In [51]:

print ("The shape of the object is:")

The shape of the object is:

In [52]:

print (df.shape)

(7, 3)

size示例

返回DataFrame中的元素数。参考以下示例代码：

In [53]:

import pandas as pd
import numpy as np

创建一个由 Series 构成的字典

In [54]:

d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}

创建一个DataFrame（数据帧）：

In [55]:

df = pd.DataFrame(d)
print ("Our object is:")

Our object is:

In [56]:

print (df)

    Name  Age  Rating
0    Tom   25    4.23
1  James   26    3.24
2  Ricky   25    3.98
3    Vin   23    2.56
4  Steve   30    3.20
5  Minsu   29    4.60
6   Jack   23    3.80

In [57]:

print ("The total number of elements in our object is:")

The total number of elements in our object is:

In [58]:

print (df.size)

values示例

将DataFrame中的实际数据作为NDarray返回。参考以下示例代码：

In [59]:

import pandas as pd
import numpy as np

创建一个由 Series 构成的字典

In [60]:

d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}

创建一个DataFrame（数据帧）：

In [61]:

df = pd.DataFrame(d)
print ("Our object is:")

Our object is:

In [62]:

print (df)

    Name  Age  Rating
0    Tom   25    4.23
1  James   26    3.24
2  Ricky   25    3.98
3    Vin   23    2.56
4  Steve   30    3.20
5  Minsu   29    4.60
6   Jack   23    3.80

In [63]:

print ("The actual data in our data frame is:")

The actual data in our data frame is:

In [64]:

print (df.values)

[['Tom' 25 4.23]
 ['James' 26 3.24]
 ['Ricky' 25 3.98]
 ['Vin' 23 2.56]
 ['Steve' 30 3.2]
 ['Minsu' 29 4.6]
 ['Jack' 23 3.8]]

`head()` 和 `tail()` 示例

要查看DataFrame对象的小样本，可使用 head() 和 tail() 方法。 head() 返回前n行(观察索引值)。显示元素的默认数量为5，但可以传递自定义数字值。参考以下示例代码：

In [65]:

import pandas as pd
import numpy as np

创建一个由 Series 构成的字典

In [66]:

d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}

创建一个DataFrame（数据帧）：

In [67]:

df = pd.DataFrame(d)
print ("Our data frame is:")

Our data frame is:

In [68]:

print (df)

    Name  Age  Rating
0    Tom   25    4.23
1  James   26    3.24
2  Ricky   25    3.98
3    Vin   23    2.56
4  Steve   30    3.20
5  Minsu   29    4.60
6   Jack   23    3.80

In [69]:

print ("The first two rows of the data frame is:")

The first two rows of the data frame is:

In [70]:

print (df.head(2))

    Name  Age  Rating
0    Tom   25    4.23
1  James   26    3.24

tail() 返回最后 n 行(观察索引值)。显示元素的默认数量为5，但可以传递自定义数字值。

In [71]:

import pandas as pd
import numpy as np

创建一个由 Series 构成的字典

In [72]:

d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]), 
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}

创建一个DataFrame（数据帧）：

In [73]:

df = pd.DataFrame(d)
print ("Our data frame is:")

Our data frame is:

In [74]:

print (df)

    Name  Age  Rating
0    Tom   25    4.23
1  James   26    3.24
2  Ricky   25    3.98
3    Vin   23    2.56
4  Steve   30    3.20
5  Minsu   29    4.60
6   Jack   23    3.80

In [75]:

print ("The last two rows of the data frame is:")

The last two rows of the data frame is:

In [76]:

print (df.tail(2))

    Name  Age  Rating
5  Minsu   29     4.6
6   Jack   23     3.8

系列基本功能

axes示例

empty示例

ndim示例

size示例

values示例

`head()` 和 `tail()` 方法示例

DataFrame基本功能

T(转置)示例

axes示例

dtypes示例

empty示例

ndim示例

shape示例

size示例

values示例

`head()` 和 `tail()` 示例

① 阅读使用手册

② 注册用户账号

介绍

平台内核

注意事项

系列基本功能

axes示例

empty示例

ndim示例

size示例

values示例

head() 和 tail() 方法示例

DataFrame基本功能

T(转置)示例

axes示例

dtypes示例

empty示例

ndim示例

shape示例

size示例

values示例

head() 和 tail() 示例

① 阅读使用手册

② 注册用户账号

③ 登陆

Python基础

Python进阶

标准类库

专题工具

图像处理

科学计算

自然语言

开源GIS

R 编程语言

Julia编程语言

介绍

平台内核

注意事项

`head()` 和 `tail()` 方法示例

`head()` 和 `tail()` 示例