贝利信息

pandas read_excel 如何只读取特定 sheet 且跳过前几行

日期:2026-01-25 00:00 / 作者:冰川箭仙
read_excel 中 sheet_name 与 skiprows 组合使用最常用可靠:先定位目标 sheet,再从其第 0 行起跳过指定行数;sheet_name 支持字符串、整数或列表,单表推荐字符串;skiprows 支持整数或可调用对象。

read_excel 指定 sheet_name 和 skiprows 参数组合使用

直接用 sheet_name 选表、skiprows 跳行是最常用也最可靠的方式。pandas 会先定位到目标 sheet,再从该 sheet 的第 0 行开始计数跳过指定行数。

当跳过的行里有合并单元格或空行时怎么办

Excel 常见的“多层标题”或“单位说明行”会导致 skiprows 数不准。这时不能只靠硬跳,得结合 header 定位真实列名行。

读取后发现列名错位或数据偏移

典型现象是第一列全是 NaN,或数据整体右移一列——大概率是 Excel 中存在隐藏的空首列(比如 A 列全空),pandas 把它当成了索引列。

性能与兼容性提醒

如果文件极大或 sheet 很多,sheet_name 设为具体名称比 None(读全部)快得多;但引擎选择会影响 skiprows 行为。

真正麻烦的是那些手动合并、手写注释、动态插入空行的业务 Excel——它们让自动化读取变成模式识别问题,这时候与其调参,不如先让人清理源文件。