当前位置：首页 > Python > 正文

Python ndarray完全指南：高效科学计算的核心工具 | NumPy教程

NiuSong
Python
2025-08-07
807

Python中ndarray完全指南

高效科学计算的核心工具

什么是ndarray？

在Python科学计算领域，ndarray（N-dimensional array，N维数组）是NumPy库的核心数据结构。它提供了高效存储和操作多维同质数据的能力，是科学计算、数据分析和机器学习的基础。

ndarray关键特性：

多维容器 - 可表示向量(1D)、矩阵(2D)或更高维数据
同质数据类型 - 所有元素必须是相同类型
高效内存布局 - 数据在内存中连续存储
向量化操作 - 支持对整个数组进行高效数学运算
广播机制 - 支持不同形状数组的运算

与Python原生列表相比，ndarray在性能上具有显著优势，特别是在处理大型数据集时。这是因为ndarray在内存中使用连续块存储数据，并且操作由预编译的C代码执行。

创建ndarray的多种方法

1. 从Python列表创建

import numpy as np

# 创建一维数组
arr1 = np.array([1, 2, 3, 4, 5])
print(arr1)  # 输出: [1 2 3 4 5]

# 创建二维数组
arr2 = np.array([[1, 2, 3], [4, 5, 6]])
print(arr2)
# 输出:
# [[1 2 3]
#  [4 5 6]]

2. 使用NumPy内置函数

# 创建全零数组
zeros_arr = np.zeros((2, 3))  # 2行3列
print(zeros_arr)
# 输出:
# [[0. 0. 0.]
#  [0. 0. 0.]]

# 创建全一数组
ones_arr = np.ones((3, 2))  # 3行2列
print(ones_arr)
# 输出:
# [[1. 1.]
#  [1. 1.]
#  [1. 1.]]

# 创建单位矩阵
eye_arr = np.eye(3)  # 3x3单位矩阵
print(eye_arr)
# 输出:
# [[1. 0. 0.]
#  [0. 1. 0.]
#  [0. 0. 1.]]

# 创建等差数列
range_arr = np.arange(0, 10, 2)  # 0到10（不含），步长为2
print(range_arr)  # 输出: [0 2 4 6 8]

# 创建随机数组
random_arr = np.random.rand(2, 2)  # 2x2随机数组，值在[0,1)
print(random_arr)

ndarray的核心属性

ndim

数组的维度（轴）数量

arr = np.array([[[1,2], [3,4]], [[5,6], [7,8]]])
print(arr.ndim)  # 输出: 3

shape

数组每个维度的长度

arr = np.array([[1,2,3], [4,5,6]])
print(arr.shape)  # 输出: (2, 3)

size

数组元素的总个数

arr = np.array([[1,2,3], [4,5,6]])
print(arr.size)  # 输出: 6

dtype

数组元素的数据类型

arr = np.array([1, 2, 3])
print(arr.dtype)  # 输出: int64

arr_float = np.array([1.0, 2.0, 3.0])
print(arr_float.dtype)  # 输出: float64

ndarray基本操作

索引与切片

arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

# 获取单个元素
print(arr[1, 2])  # 输出: 6

# 切片获取子数组
print(arr[0:2, 1:3])
# 输出:
# [[2 3]
#  [5 6]]

# 使用步长
print(arr[::2, ::2])
# 输出:
# [[1 3]
#  [7 9]]

形状操作

arr = np.arange(1, 10)  # [1, 2, 3, 4, 5, 6, 7, 8, 9]

# 改变形状
reshaped = arr.reshape(3, 3)
print(reshaped)
# 输出:
# [[1 2 3]
#  [4 5 6]
#  [7 8 9]]

# 展平数组
flattened = reshaped.flatten()
print(flattened)  # 输出: [1 2 3 4 5 6 7 8 9]

数学运算

a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

# 逐元素加法
print(a + b)  # 输出: [5 7 9]

# 逐元素乘法
print(a * b)  # 输出: [4 10 18]

# 矩阵乘法
matrix_a = np.array([[1, 2], [3, 4]])
matrix_b = np.array([[5, 6], [7, 8]])
print(np.dot(matrix_a, matrix_b))
# 输出:
# [[19 22]
#  [43 50]]

# 数学函数
print(np.sin(a))  # 计算正弦值
print(np.exp(a))  # 计算指数
print(np.log(b))  # 计算自然对数

ndarray的高级功能

广播机制

NumPy的广播机制允许不同形状的数组进行算术运算

# 数组与标量运算
arr = np.array([[1, 2, 3], [4, 5, 6]])
print(arr * 2)
# 输出:
# [[ 2  4  6]
#  [ 8 10 12]]

# 不同形状数组运算
a = np.array([[1], [2], [3]])  # 3x1
b = np.array([4, 5, 6])       # 3
print(a + b)
# 输出:
# [[5 6 7]
#  [6 7 8]
#  [7 8 9]]

布尔索引

使用布尔数组进行条件筛选

arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

# 找出大于5的元素
print(arr[arr > 5])  # 输出: [6 7 8 9]

# 多条件筛选
condition = (arr > 3) & (arr < 8)
print(arr[condition])  # 输出: [4 5 6 7]

聚合函数

对数组进行统计计算

arr = np.array([[1, 2], [3, 4], [5, 6]])

print(np.sum(arr))      # 总和: 21
print(np.mean(arr))     # 平均值: 3.5
print(np.min(arr))      # 最小值: 1
print(np.max(arr))      # 最大值: 6
print(np.std(arr))      # 标准差: 1.707...

# 沿特定轴计算
print(np.sum(arr, axis=0))  # 列和: [9 12]
print(np.mean(arr, axis=1)) # 行平均: [1.5 3.5 5.5]

ndarray与Python列表性能对比

操作	ndarray	Python列表	性能差异
元素级加法	向量化操作	循环遍历	10-100倍
数学函数计算	C编译代码	Python解释	50-200倍
内存使用	连续存储	指针存储	更节省内存
大型数据处理	高效并行	单线程	显著优势

结论：对于数值计算任务，ndarray通常比Python列表快10-100倍，特别是在处理大型数据集时。这种性能优势主要源于：

连续内存布局
向量化操作避免Python循环开销
底层使用C/C++/Fortran优化代码

为什么ndarray是科学计算的基石？

高效性

优化的内存布局和向量化操作使ndarray能够高效处理大规模数据，远超Python原生数据结构。

互操作性

作为科学计算生态系统的基础，ndarray与Pandas、Matplotlib、Scikit-learn等库无缝集成。

表达力

简洁的语法支持复杂数学运算，使代码更易读、更接近数学表达式。

标准化

成为Python科学计算领域事实上的标准，被广泛应用于学术界和工业界。

掌握ndarray是使用Python进行高效科学计算、数据分析和机器学习的基础。几乎所有高级科学计算库都构建在NumPy和ndarray之上。

本文由NiuSong于2025-08-07发表在吾爱品聚，如有疑问，请联系我们。
本文链接：https://liuhe.jltcw.com/20257497.html

Python ndarray完全指南：高效科学计算的核心工具 | NumPy教程

Python中ndarray完全指南

什么是ndarray？

创建ndarray的多种方法

1. 从Python列表创建

2. 使用NumPy内置函数

ndarray的核心属性

ndim

shape

size

dtype

ndarray基本操作

索引与切片

形状操作

数学运算

ndarray的高级功能

广播机制

布尔索引

聚合函数

ndarray与Python列表性能对比

为什么ndarray是科学计算的基石？

高效性

互操作性

表达力

标准化

Python全栈开发是什么？从入门到精通的完整指南 | Python全栈教程

苹果千亿美元换关税豁免：库克的妥协与特朗普的胜利

发表评论取消回复

Python ndarray完全指南：高效科学计算的核心工具 | NumPy教程

什么是ndarray？

创建ndarray的多种方法

1. 从Python列表创建

2. 使用NumPy内置函数

ndarray的核心属性

ndim

shape

size

dtype

ndarray基本操作

索引与切片

形状操作

数学运算

ndarray的高级功能

广播机制

布尔索引

聚合函数

ndarray与Python列表性能对比

为什么ndarray是科学计算的基石？

高效性

互操作性

表达力

标准化

Python全栈开发是什么？从入门到精通的完整指南 | Python全栈教程

苹果千亿美元换关税豁免：库克的妥协与特朗普的胜利

相关文章

发表评论取消回复