Python中Series常用方法整理 | Pandas数据处理核心教程

什么是Pandas Series？

Pandas Series是Python数据分析库中的一种一维数组结构，能够存储任何数据类型（整数、字符串、浮点数、Python对象等）。每个Series都有一个索引，类似于字典的键，提供高效的数据访问能力。

Series核心特点：

类似NumPy的一维数组，但具有更丰富的功能
可自定义索引标签
支持向量化操作（无需显式循环）
提供大量数据操作和统计方法
自动对齐不同索引的数据

创建Series

创建Series的基本语法：pd.Series(data, index=index)

示例代码：

import pandas as pd

# 从列表创建
data = [10, 20, 30, 40]
s1 = pd.Series(data)
print(s1)

# 从字典创建（自动使用键作为索引）
data_dict = {'a': 1, 'b': 2, 'c': 3}
s2 = pd.Series(data_dict)
print(s2)

# 指定索引
s3 = pd.Series([5, 6, 7, 8], index=['x', 'y', 'z', 'w'])
print(s3)

Series常用方法详解

方法	描述	使用示例
`head()`	返回前n行数据，默认5行	`s.head(3)`
`tail()`	返回最后n行数据，默认5行	`s.tail(3)`
`describe()`	生成描述性统计摘要	`s.describe()`
`value_counts()`	返回唯一值及其计数	`s.value_counts()`
`sort_values()`	按值排序	`s.sort_values(ascending=False)`
`sort_index()`	按索引排序	`s.sort_index()`
`isnull()`	检测缺失值	`s.isnull()`
`fillna()`	填充缺失值	`s.fillna(0)`
`dropna()`	删除缺失值	`s.dropna()`
`apply()`	应用函数到每个元素	`s.apply(lambda x: x**2)`
`map()`	根据输入映射值	`s.map({1: 'one', 2: 'two'})`
`unique()`	返回唯一值数组	`s.unique()`
`nunique()`	返回唯一值的数量	`s.nunique()`

数据统计示例

# 创建示例Series
temps = pd.Series([22.1, 23.5, 21.8, None, 24.3, 22.9, 23.1])

# 基本统计信息
print("平均值:", temps.mean())
print("最大值:", temps.max())
print("标准差:", temps.std())

# 描述性统计
print(temps.describe())

# 填充缺失值
temps_filled = temps.fillna(temps.mean())
print("填充后:\n", temps_filled)

数据转换示例

# 创建示例Series
fruits = pd.Series(['apple', 'banana', 'orange', 'apple', 'banana'])

# 值计数
print("水果计数:\n", fruits.value_counts())

# 映射转换
size_map = {'apple': 'medium', 'banana': 'large', 'orange': 'medium'}
print("水果大小:\n", fruits.map(size_map))

# 应用函数转换
print("首字母大写:\n", fruits.apply(lambda x: x.capitalize()))

# 唯一值
print("唯一水果:", fruits.unique())