Python无中文版,需统一源码(UTF-8声明)、终端(chcp 65001或reconfigure)、文件I/O(显式encoding)、HTTP响应(r.encoding)、系统locale及第三方库编码设置,六者不一致导致乱码。
Python 本身没有“中文版”概念,所谓“改为中文版”实际是调整终端、IDE 或程序运行时的字符编码与区域设置,让中文能正常显示、输入和处理。核心问题不是换语言包,而是解决 UnicodeDecodeError、乱码、locale.getpreferredencoding() 返回 'cp936'(Windows)或 'UTF-8'(Linux/macOS)不一致等现象。
很多中文乱码源于源文件保存编码与解释器读取编码不匹配。即使系统 locale 是中文,Python 默认仍按字节流读取文件,不自动识别 BOM 或声明。
.py 文件开头必须加编码声明:# -*- coding: utf-8 -*-
SyntaxError;推荐用 VS Code 手动选 “Save with Encoding → UTF-8”Windows 默认控制台编码是 cp936(GBK),而 Python 3 默认用 UTF-8 字符串,直接 print('你好') 会触发 UnicodeEncodeError。
chcp 65001 切换控制台到 UTF-8 模式import sys sys.stdout.reconfigure(encoding='utf-8')(仅 Python 3.7+)
print('你好'.encode('utf-8').decode(sys.stdout.encoding or 'utf-8', errors='ignore')) 过于繁琐,不如统一用 chcp 65001
locale.getdefaultlocale() 返回 ('zh_CN', 'cp936') 并不保证 Python I/O 流就用该编码 —— 实际以 sys.stdout.encoding 为准,它由终端环境决定,不受 Python 内部 locale 设置影响。
立即学习“Python免费学习笔记(深入)”;

import sys; print(sys.stdout.encoding)查看真实编码,常见值:
'utf-8'(WSL/Linux/macOS)、'cp936'(Windows cmd 未切编码)、'None'(重定向到文件或管道时)None,说明输出被重定向,此时 print() 会 fallback 到 locale.getpreferredencoding(),但该值可能仍是 cp936,导致写入 UTF-8 文件时出错with open('out.txt', 'w', encoding='utf-8') as f:
print('你好', file=f)这类问题常被误认为“Python 不支持中文”,实则是底层 C 库或操作系统 API 对宽字符路径支持不足,或库未正确传递 encoding 参数。
requests.get() 返回中文网页内容:务必检查 r.encoding,它可能被错误推断为 'ISO-8859-1';应设为 r.encoding = 'utf-8' 或用 r.content.decode('gbk')(针对国内网站)pandas.read_csv('数据.csv') 报错:Windows 下中文路径通常没问题,但若含 Unicode 字符(如 emoji 或生僻字),建议用 pathlib.Path 构造路径,并显式传 encoding='utf-8'
subprocess.run() 执行含中文参数的命令:Windows 上需确保 shell=True 且终端已 chcp 65001;Linux/macOS 一般无问题,但注意 env 中不要覆盖 LANG 或 LC_ALL
真正卡住人的往往不是“怎么设中文”,而是没意识到:Python 解释器、源文件编码、终端编码、文件系统路径编码、HTTP 响应头声明、第三方库默认行为——这六者可以各自不同。逐项查 sys.stdout.encoding、open().encoding、r.apparent_encoding、locale.getpreferredencoding(),比盲目改 registry 或装“中文版 Python”有效得多。