import numpy as np

L = np.random.random(100)
sum(L)

47.16471352916828

np.sum(L)

47.16471352916824

big_array = np.random.rand(1000000)
%timeit sum(big_array)
%timeit np.sum(big_array)

85.5 ms ± 994 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)
355 µs ± 792 ns per loop (mean ± std. dev. of 7 runs, 1,000 loops each)

min(big_array), max(big_array)

(1.1593646734864294e-06, 0.9999989268230569)

np.min(big_array), np.max(big_array)

(1.1593646734864294e-06, 0.9999989268230569)

%timeit min(big_array)
%timeit np.min(big_array)

58.2 ms ± 1.05 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
344 µs ± 1.83 µs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)

print(big_array.min(), big_array.max(), big_array.sum())

1.1593646734864294e-06 0.9999989268230569 500121.7142563756

M = np.random.random((3, 4))
print(M)

[[0.58825819 0.54628085 0.38710941 0.64627323]
 [0.79441627 0.10726828 0.10424018 0.13600543]
 [0.9110518  0.55308535 0.02069638 0.14462064]]

M.sum()

4.939306024160479

M.min(axis=0)

array([0.58825819, 0.10726828, 0.02069638, 0.13600543])

M.max(axis=1)

array([0.64627323, 0.79441627, 0.9110518 ])

!head -4 ../data/president_heights.csv

order,name,height(cm)
1,George Washington,189
2,John Adams,170
3,Thomas Jefferson,189

import pandas as pd
data = pd.read_csv('../data/president_heights.csv')
heights = np.array(data['height(cm)'])
print(heights)

[189 170 189 163 183 171 185 168 173 183 173 173 175 178 183 193 178 173
 174 183 183 168 170 178 182 180 183 178 182 188 175 179 183 193 182 183
 177 185 188 188 182 185]

print("Mean height:       ", heights.mean()) # 身高平均值
print("Standard deviation:", heights.std()) # 标准差
print("Minimum height:    ", heights.min()) # 最小值
print("Maximum height:    ", heights.max()) # 最大值

Mean height:        179.73809523809524
Standard deviation: 6.931843442745892
Minimum height:     163
Maximum height:     193

print("25th percentile:   ", np.percentile(heights, 25)) # 25% 分位值
print("Median:            ", np.median(heights)) # 50% 分位值 - 中位值
print("75th percentile:   ", np.percentile(heights, 75)) # 75% 分位值

25th percentile:    174.25
Median:             182.0
75th percentile:    183.0

%matplotlib inline
import matplotlib.pyplot as plt
import seaborn; seaborn.set()  # 设置图表的风格为seaborn

plt.hist(heights)
plt.title('Height Distribution of US Presidents')
plt.xlabel('height (cm)')
plt.ylabel('number');

函数名称	NaN安全版本	说明
`np.sum`	`np.nansum`	计算总和
`np.prod`	`np.nanprod`	计算乘积
`np.mean`	`np.nanmean`	计算平均值
`np.std`	`np.nanstd`	计算标准差
`np.var`	`np.nanvar`	计算方差
`np.min`	`np.nanmin`	计算最小值
`np.max`	`np.nanmax`	计算最大值
`np.argmin`	`np.nanargmin`	寻找最小值的序号
`np.argmax`	`np.nanargmax`	寻找最大值的序号
`np.median`	`np.nanmedian`	计算中位值
`np.percentile`	`np.nanpercentile`	计算百分比分布的对应值
`np.any`	N/A	是否含有True值
`np.all`	N/A	是否全为True值

在数组中求总和

最小值和最大值

多维聚合

其他聚合函数

例子：美国总统的平均身高？

① 阅读使用手册

② 注册用户账号

介绍

平台内核

注意事项

在数组中求总和

最小值和最大值

多维聚合

其他聚合函数

例子：美国总统的平均身高？

① 阅读使用手册

② 注册用户账号

③ 登陆

Python基础

Python进阶

标准类库

专题工具

图像处理

科学计算

自然语言

开源GIS

R与Julia

介绍

平台内核

注意事项