python json 模块进阶用法包括:自定义 default 函数序列化类实例;用 object_hook 反序列化为对象;ensure_ascii=false 保留中文;文件操作需显式指定 utf- 8 编码;通过 parse_float/parse_int 等参数增强安全性,禁用 eval 系函数。

Python 的 json 模块不只是 loads() 和dumps()这么简单——掌握进阶用法,能帮你更稳、更快、更灵活地处理真实场景中的 JSON 数据。
自定义对象序列化:让类实例变 JSON
默认情况下,json.dumps()无法直接处理自定义类实例,会报 TypeError: Object of type XXX is not JSON serializable。解决方法是提供default 参数,告诉 JSON 编码器“遇到不认识的类型时怎么转”:
示例:将 Person 类转为 JSON
import json <p>class Person: def <strong>init</strong>(self, name, age): self.name = name self.age = age</p><p>def person_to_dict(obj): if isinstance(obj, Person): return {'name': obj.name, 'age': obj.age} raise TypeError(f"Object of type {type(obj).<strong>name</strong>} is not JSON serializable")</p><p>data = Person("Alice", 30) json_str = json.dumps(data, default=person_to_dict, indent=2) print(json_str)</p><h1> 输出:</h1><h1>{</h1><h1>"name": "Alice",</h1><h1>"age": 30</h1><h1>}</h1><p>
反序列化时还原对象:从 JSON 重建实例
json.loads()默认只返回字典或列表,若想还原成具体类对象,可用 object_hook 参数——它会在每个 JSON 对象(即每个dict)解析完成后被调用:
- 定义一个函数,接收解析后的
dict,判断是否应构造某类实例 - 返回原始
dict(不做处理)或返回新创建的对象
示例:把含 ”type” 字段的 JSON 自动转为对应类实例
def dict_to_obj(d): if d.get("type") == "person": return Person(d["name"], d["age"]) return d # 其他情况保持原样 <p>json_data = '{"type": "person", "name": "Bob", "age": 25}' obj = json.loads(json_data, object_hook=dict_to_obj) print(type(obj), obj.name) # <class '<strong>main</strong>.Person'> Bob
处理中文、特殊字符与编码细节
默认 json.dumps() 会把非 ASCII 字符(如中文)转义为 uXXXX 格式,影响可读性。用 ensure_ascii=False 即可保留原文:
-
json.dumps(data, ensure_ascii=False)→ 输出中文而非 u4f60u597d - 写入文件时,务必显式指定
encoding='utf-8',避免平台默认编码出错 - 读取文件时也建议用
open(……, encoding='utf-8')打开,再传给json.load()
另外,sort_keys=True能让键名有序输出,便于比对;indent=2提升可读性,调试时很实用。
安全解析不可信 JSON:避免执行危险操作
来自外部(如 API、用户上传)的 JSON 可能含恶意结构(例如超深嵌套、超大数组),导致内存溢出或拒绝服务。标准 json 模块不带限流机制,但可通过以下方式加固:
- 用
json.loads(s, parse_float=str, parse_int=str)防止数字过大引发精度丢失或异常 - 结合
sys.setrecursionlimit()限制嵌套深度(需谨慎,影响全局) - 更稳妥的做法:先用
json.scanner.make_scanner()手动扫描,或改用第三方库如ijson流式解析大文件 - 永远不要用
eval()或ast.literal_eval()代替json.loads()——它们不校验 JSON 语法,有代码注入风险






























