python3字符编码是什么？怎么用？

冷炫風刃 2025-12-02 00:00:00 次阅读

Python3中字符编码基于Unicode，str为文本类型，bytes为字节类型，通过encode()和decode()实现转换，文件操作需显式指定encoding如utf-8以避免乱码。

Python3 中的字符编码本质上是处理文本和字节之间的转换方式。Python3 默认使用 Unicode 编码来表示字符串，具体实现上采用的是 UTF-8 作为默认的源文件编码和常用编码格式。

在 Python3 中有两个主要的数据类型需要区分：

字符串要通过编码（encode）转成字节，字节要通过解码（decode）还原成字符串。

实际使用中，你经常需要在字符串和字节之间转换：

如果编码不匹配会导致错误，例如用 gbk 解码一个 UTF-8 的字节流会报 UnicodeDecodeError。

读写文本文件时，推荐显式指定编码方式，避免平台差异问题：

with open('data.txt', 'r', encoding='utf-8') as f:
content = f.read()

写入时也一样：

with open('output.txt', 'w', encoding='utf-8') as f:
f.write("包含中文的内容")

如果不指定，Python 会使用系统默认编码（Windows 可能是 gbk，Linux/macOS 通常是 utf-8），容易出错。

可以通过以下代码查看当前默认编码：

import sys
print(sys.getdefaultencoding())

这个值通常是 utf-8，但不能修改。所有字符串操作都基于 Unicode，无需手动设置全局编码。

基本上就这些。只要记住：文本用 str，传输用 bytes，转换靠 encode/decode，读写文件加 encoding 参数，就能避开大多数编码问题。

上一篇文章

如何用Golang处理RPC错误与重试_Golang RPC

2025-12-02 1329次阅读

下一篇文章

2025-12-02 1994次阅读