贝利信息

Python 如何让子进程崩溃时主进程也能收到详细错误

日期:2026-01-25 00:00 / 作者:舞夢輝影
子进程崩溃时 subprocess.run() 默认不抛出异常,需通过 capture_output=True 和 text=True 获取 stderr 中的 traceback 或段错误信息,并检查 returncode 判断是否被信号终止。

子进程崩溃时 subprocess.run() 默认不暴露底层异常

直接调用 subprocess.run() 并捕获 subprocess.CalledProcessError 只能拿到退出码和标准输出,但看不到子进程内部的 Python traceback、段错误(SIGSEGV)或未捕获异常的原始堆栈。这是因为子进程的异常信息默认被截断在它自己的 stderr 里,主进程没做透传处理。

关键点在于:子进程崩溃 ≠ 主进程抛出 Python 异常;它只是提前退出,主进程需要主动读取并解析它的 stderr 才能还原现场。

subprocess.Popen 拿到完整 stderr 并手动检查

subprocess.run() 是封装,而 subprocess.Popen 给你控制权。崩溃时,子进程的 Python traceback 一定在 stderr 中,只要你不丢弃它,就能提取出来。

示例场景:运行一个故意报错的 Python 脚本

import subprocess
import sys

proc = subprocess.Popen( [sys.executable, "-c", "raise ValueError('boom')"], stdout=subprocess.PIPE, stderr=subprocess.PIPE, text=True # 关键:用 text=True 直接得 str,避免 bytes.decode() 出错 ) stdout, stderr = proc.communicate() # 等待结束,必须调用!

if proc.returncode != 0: print("子进程崩溃,返回码:", proc.returncode) if stderr: print("详细错误:") print(stderr) # 这里就包含完整的 traceback

捕获 SIGSEGV / 段错误这类系统级崩溃

Python 子进程因 C 扩展或 ctypes 调用触发段错误时,不会打印 Python traceback,Linux 下通常只输出 Segmentation fault (core dumped) 到 stderr,且可能被截断。

这时候仅靠 stderr 不够可靠,要结合退出信号判断:

注意:生产环境一般禁用 core dump,所以

更实用的做法是让子进程自己做防御性包装,比如用 try/except BaseException 捕获所有异常并强制 flush + print traceback 到 stderr。

subprocess.run() 的简洁写法也能拿到详细错误

如果你坚持用 subprocess.run()(比如为了代码简洁),仍然可以拿到完整错误信息,只需注意参数组合:

result = subprocess.run(
    [sys.executable, "-c", "import sys; sys.exit(1)"],
    capture_output=True,
    text=True,
    timeout=10
)

if result.returncode != 0: print("错误输出:", result.stderr) # 包含 traceback(如果是 Python 异常) print("返回码:", result.returncode)

最易忽略的一点:很多人把子进程错误当成“主进程异常”来 try/except,结果什么也没 catch 到 —— 子进程崩溃从来不会自动变成主进程的 Python 异常,它只是 returncode 变了,stderr 有内容了。你得主动看、主动读、主动判。