开发者

详解Golang的GC三色标记法

目录
  • 一 概念基础
    • 1.1三色标记法将对象分为三类
    • 1.2 标记过程
    • 1.编程3 STW
    • 1.4 屏障机制
      • 1.4.1强、弱三色不变式
      • 1.4.2 插入屏障
      • 1.4.3 删除屏障
      • 1.4.4 混合屏障
  • 二 GC过程
    • 2.1 阶段1:Mark Setup 标记准备
      • 2.2 阶段2:Marking 标记
        • 2.3阶段3:Mark Termination 标记结束
          • 2.4 阶段4:Sweeping 清理

          一 概念基础

          1.1三色标记法将对象分为三类

          把图过程中遇到的对象,按“是否访问过”这个条件标记成以下三种颜色:

          白色对象(可能死亡):未被回收器访问到的对象。在回收开始编程客栈阶段,所有对象均为白色,当回收结束后,白色对象均不可达。

          灰色对象(波面):已被回收器访问到的对象,但回收器需要对其中的一个或多个指针进行扫描,因为他们可能还指向白色对象。

          黑色对象(确定存活):已被回收器访问到的对象,其中所有字段都已被扫描,黑色对象中python任何一个指针都不可能直接指向白色对象。

          1.2 标记过程

          • 起初所有的对象都是白色的;
          • 从根对象出发扫描所有可达对象,标记为灰色,放入待处理队列;
          • 从待处理队列中取出灰色对象,将其引用的对象标记为灰色并放入待处理队列中,自身标记为黑色;
          • 重复步骤3,直到待处理队列为空,此时白色对象即为不可达的“垃圾”,回收白色对象;
          • 回收所有的白色对象,也就是回收垃圾

          根对象

          在垃圾回收的术语中又叫做根集合,它是垃圾回收器在标记过程时最先检查的对象。

          • 全局变量:程序在编译期就能确定的那些存在于程序整个生命周期的变量。
          • 执行栈:每个 goroutine 都包含自己的执行栈,这些执行栈上包含栈上的变量及指向分配的堆内存区块的指针。
          • 寄存器:寄存器的值可能表示一个指针,参与计算的这些指针可能指向某些赋值器分配的堆内存区块。

          1.3 STW

          STW(Stop The World)机制是指在进行垃圾回收时,会暂停应用程序的运行,js以便进行垃圾回收操作。这意味着在进行垃圾回收时,应用程序将无法继续执行。

          为什么需要STW

          STW(Stop-The-World)机制来确保并发操作的正确性。

          如果不设置STW机制,那么在进行GC时,应用程序线程可能会继续执行,从而导致内存管理的不一致性和错误。此外,GC可能会导致内存分配和释放的不连续,从而导致内存碎片化问题。

          因此,需要STW机制来确保GC的正确性和内存管理的一致性。虽然STW机制会导致一定的性能损失,但是这是必要的代价,以确保应用程序的正确性和稳定性。

          1.4 屏障机制

          1.4.1强、弱三色不变式

          强三色不变式:强制性的不允许黑色对象引用白色对象,只能引用灰色对象,这样就不会出现白色对象被误删的情况。

          弱三色不等式 :

          保护灰色对象到白色对象的路径不会断;

          黑色对象可以引用白色对象,白色对象存在其他灰色对象对它的引用。

          或可达它的链路上游存在灰色对象。这样实则是黑色对象引用白色对象,白色对象处于一个被删除的状态,但是上游灰色对象的引用,可以保护白色对象,使其安全。

          为了遵循上述两种方式,GC算法演进到两种屏障方式,“插入屏障”和“删除屏障”。

          1.4.2 插入屏障

          在A对象引用B对象时,B对象被标记为灰色。(将B挂在A下游,B必须被标记为灰色)

          满足强三色不等式。

          插入屏障机制在栈空间的对象操作不使用,仅仅使用在堆空间对象的操作中。

          1.4.3 删除屏障

          被删除的对象,如果本身为灰色或白色,那么标记为灰色。

          满足弱三色不等式。

          1.4.4 混合屏障

          插入写屏障和删除写屏障的缺点:

          • 插入写屏障:结束时需要STW来重新扫描栈,标记栈上引用的白色对象存活
          • 删除写屏障:回收精度低,GC开始时STW扫描堆栈来记录快照,这个过程会保护开始时刻的所有的存活对象。

          Go1.8引入混合写屏障机制,避免了对栈的重复扫描过程,极大减少了STW的时间。

          • GC开始将栈上的对象全部扫描并标记为黑色(之后不再进行第二次重复扫描,无需STW)
          • GC期间,任何在栈上创建的新对象,都标记为黑色
          • 被删除的对象标记为灰色
          • 被添加的对象标记为灰色

          二 GC过程

          2.1 阶段1:Mark Setup 标记准备

          为了打开写屏障,必须停止每个goroutine,让垃圾收集器观察并等待每个goroutine进行函数调用,等待函数调用是为了保证goroutine停止时处于安全点。(期间会STW)

          2.2 阶段2:Marking 标记

          一旦写屏障打开,垃圾收集器就开始标记阶段。

          标记阶段需要标记在堆内存中仍然在使用中的值。首先检查所有现goroutine的堆栈,以找到堆内存的根指针。然后收集器必须从那些根指针遍历堆内存图,标记可以回收的内存。

          当存在新的内存分配时,会暂停分配内存过快的那些 goroutine,并将其转去执行一些辅助标记(Mark Assist)的工作,从而达到放缓继续分配、辅助 GC 的标记工作的目的。

          2.3阶段3:Mark Termination 标记结束

          这个阶段会关闭掉阶段1开启的屏障,并计算下一次清理的目标和计划。(本阶段会STW)

          2.4 阶段4:Sweeping 清理

          清理阶段用于回收标记阶段中标记出来的可回收内存。当应用程序goroutine尝试在堆内存中分配新内存时,会触发该操作,清理导致的延迟和吞吐量降低被分散到每次内存分配时。

          本阶段会并发javascript执行,清除前面标记出来需清理的内存。

          以上就是详解golang的GC三色标记法的详细内容,更多关于Golang GC 三色标记法的资料请关注我们其它相关文章!

          0

          上一篇:

          下一篇:

          精彩评论

          暂无评论...
          验证码 换一张
          取 消

          最新开发

          开发排行榜