Python提供了多种高效处理数据的工具，其中列表推导式、生成器和迭代器是核心机制。三者既有相似性，也有显著差异，适用于不同场景。

列表推导式

列表推导式是颇具python风格的一种写法。这种写法除了高效，也更简短。

In [2]:

{i:el for i,el in enumerate(["one","two","three"])}

Out[2]:

{0: 'one', 1: 'two', 2: 'three'}

enumerate() 是内建函数，可以让列表获得“下标”的属性。如果不用列表推导式，则上例需要这么写：

In [3]:

lst = ["one","two","three"]
i = 0
for e in lst:
    lst[i] = '%d: %s' % (i,lst[i])
    i +=1
lst

Out[3]:

['0: one', '1: two', '2: three']

迭代器

迭代器属于一个临时区，安排一些元素在里面，但只有用的时候才会创建一些临时区，一旦遍历结束则临时区清空，再遍历就失效了。所以说迭代器能够减少内存的开销。

下面用代码来说明这句话的意思。

In [4]:

import sys
i = iter(range(10000))
id(i.__next__())

Out[4]:

93933276092968

In [5]:

sys.getsizeof(i)

Out[5]:

In [6]:

sys.getsizeof(i.__next__())

Out[6]:

In [7]:

e = range(10000)
sys.getsizeof(e)

Out[7]:

In [8]:

sys.getsizeof(list(e))

Out[8]:

可以看到，如果一次性把 list 全部加载进来，需要 80056byte 内存空间，如果使用迭代器迭代，仅仅需要 28byte 内存空间。

可以被 next() 函数调用并不断返回下一个值的对象称为迭代器。生成器都是 Iterator 对象，但 list 、 dict 、 str 虽然是 Iterable ，却不是 Iterator ， list , tuple , dict , str 有可迭代属性(惰性循环)的，但如果需要转化成可迭代对象，可以用 iter() 来转换，验证方式就是看对象是否有__next__方法。

生成器(generator)

生成器是一种特殊的迭代器。

什么时候需要用生成器

其实一般情况下是不需要生成器的，只有因为性能限制才需要用到，比如需要用python来 read 一个 10g 的 txt 文件，如果一次性把 10g 的文件加载到内存再处理( .read() 方法)，内存肯定溢出了。这里如果使用生成器，就可以把读和处理交叉进行，比如使用( .readline 和 .readlines )就可以在循环读取的同时不断处理，这样可以节省大量内存空间。此外，还可以使用生成器生成线程池。

（如果当自己写一个读写函数封装给别人使用时,那么要考虑到文件容量问题,此时应该考虑使用生成器。）

生成生成器的两种方法

第一种比较简单，将列表推导式的 [] 改称 () 就可以了：

In [9]:

g = (x*x for x in range(10))

第二种办法就是在函数里加入 yield 关键字。 yield 和 return 有点类似，都可以用来返回值，不同的是 yield 遇到 next() 就返回，再次执行时从上次返回的 yield 语句处继续执行。

如何判断一个函数是否是生成器

判断生成器的办法就是查看其属性。

In [10]:

'__next__' in dir(g)

Out[10]:

True

在这里可以看到 g 有一个__next__的魔术方法，而这是生成器所特有的属性，下面两种方式调用都可以。

In [11]:

g.__next__()

Out[11]:

In [12]:

g.__next__()

Out[12]:

In [13]:

next(g)

Out[13]:

列表推导式

迭代器

生成器(generator)

什么时候需要用生成器

生成生成器的两种方法

如何判断一个函数是否是生成器

① 阅读使用手册

② 注册用户账号

介绍

平台内核

注意事项

列表推导式

迭代器

生成器(generator)

什么时候需要用生成器

生成生成器的两种方法

如何判断一个函数是否是生成器

① 阅读使用手册

② 注册用户账号

③ 登陆

Python基础

Python进阶

标准类库

专题工具

图像处理

科学计算

自然语言

开源GIS

R 编程语言

Julia编程语言

介绍

平台内核

注意事项