
Python GC主要使用引用计数(reference counting)来跟踪和回收垃圾。在引用计数的基础上,通过“标记-清除”(mark and sweep)解决容器对象可能产生的循环引用问题,
通过“分代回收”(generation collection)以空间换时间的方法提高垃圾回收效率。
引用计数 -
引用计数法在对象内部维护了一个被其他对象引用数的引用计数值,当这个引用计数值为0时,说明这个对象不再被其他对象引用,就可以被回收了。
结合源码来看, 所有Python对象的头部包含了这样一个结构PyObject(相当于继承自PyObject):
引用计数法有很明显的优点:
-
高效
-
运行期没有停顿
-
对象有确定的生命周期
-
易于实现
原始的引用计数法也有明显的缺点:
- 维护引用计数的次数和引用赋值成正比,而不像mark and sweep等基本与回收的内存数量有关。
- 无法解决循环引用的问题。A和B相互引用而再没有外部引用A与B中的任何一个,它们的引用计数都为1,但显然应该被回收。
- 为了解决这两个致命弱点,Python又引入了以下两种GC机制。
标记-清除
“标记-清除”法是为了解决循环引用问题。可以包含其他对象引用的容器对象(如list, dict, set,甚至class)都可能产生循环引用,为此,在申请内存时,所有容器对象的头部又加上了PyGC_Head来实现“标记-清除”机制。
分代回收
分代回收的整体思想是:将系统中的所有内存块根据其存活时间划分为不同的集合,每个集合就成为一个“代”,垃圾收集频率随着“代”的存活时间的增大而减小,存活时间通常利用经过几次垃圾回收来度量。
用来表示“代”的结构体是gc_generation, 包括了当前代链表表头、对象数量上限、当前对象数量:
|
|




近期评论