贝利信息

Python 使用 pandas 读取 Excel 文件

日期:2025-11-20 00:00 / 作者:冷炫風刃
答案:使用pandas.read_excel()可轻松读取Excel文件,需注意文件路径、工作表选择、列名设置、数据类型及缺失值处理。

使用 Python 的 pandas 读取 Excel 文件非常简单,主要依赖 pandas.read_excel() 函数。下面介绍常用方法和注意事项,帮助你快速上手。

1. 基本读取操作

最简单的用法是直接传入文件路径:

import pandas as pd

df = pd.read_excel('data.xlsx')

这会默认读取第一个工作表(sheet),并将第一行作为列名。

2. 指定工作表

如果 Excel 文件包含多个 sheet,可以通过参数指定:

df = pd.read_excel('data.xlsx', sheet_name='Sales')

3. 自定义列名和跳过行

有时数据不是从第一行开始,或列名需要自定义:

df = pd.read_excel('data.xlsx', header=0, usecols='B:D', nrows=50)

4. 处理缺失值和数据类型

pandas 会自动识别空单元格为 NaN。你也可以在读取时进行处理:

df = pd.read_excel('data.xlsx', dtype={'phone': str}, na_values=['N/A'])

基本上就这些。只要安装了 openpyxl 或 xlrd(根据 Excel 格式),pandas 就能顺利读取 .xlsx 或 .xls 文件。不复杂但容易忽略的是确保文件路径正确,以及注意数据类型的自动转换问题。