原创文章,欢迎转载,转载请注明出处,谢谢。
0. 前言
并发编程中的关键一环是锁,需要深入掌握。
1. 锁
1.1 示例
锁的实现非常简单,下面是一个示例:
var global int
func main() {
var mu sync.Mutex
var wg sync.WaitGroup
for i := 0; i < 2; i++ {
wg.Add(1)
go func(i int) {
defer wg.Done()
mu.Lock()
global++
mu.Unlock()
}(i)
}
wg.Wait()
fmt.Println(global)
}
输出:
2
在goroutine中,通过对全局变量
global
加锁,实现并发顺序增加变量。其中,
sync.Mutex.Lock()
用于对变量/临界区加锁,
sync.Mutex.Unlock()
用于对变量/临界区解锁。
1.2 sync.Mutex
我们来看一下
sync.Mutex
互斥锁的结构:
type Mutex struct {
state int32
sema uint32
}
其中,
state
表示锁的状态,
sema
表示信号量。
进入
sync.Mutex.Lock()
查看加锁的方法。
1.2.1 sync.Mutex.Lock()
func (m *Mutex) Lock() {
// Fast path: grab unlocked mutex.
if atomic.CompareAndSwapInt32(&m.state, 0, mutexLocked) {
if race.Enabled {
race.Acquire(unsafe.Pointer(m))
}
return
}
// Slow path (outlined so that the fast path can be inlined)
m.lockSlow()
}
首先进入
Fast path
逻辑,原子
CAS
操作比较锁状态
m.state
和0,如果相等则更新当前锁为已加锁状态。这里锁标志位如下:
从低(右)到高(左)的三位表示锁状态/唤醒状态/饥饿状态:
const (
mutexLocked = 1 << iota // mutex is locked
mutexWoken
mutexStarving
)
标志位初始值为0,1表示状态生效。
前三位之后的位数表示排队等待锁的goroutine数目,总共可以允许1<<(32-3)个goroutine等待锁。
假设有两个goroutine G1和G2抢占锁,其中G1通过
Fast path
获取锁,将锁的状态置为1。这时候G2未获得锁,进入
Slow path
:
func (m *Mutex) lockSlow() {
var waitStartTime int64
starving := false
awoke := false
iter := 0
old := m.state
for {
// step1: 进入自旋
if old&(mutexLocked|mutexStarving) == mutexLocked && runtime_canSpin(iter) {
if !awoke && old&mutexWoken == 0 && old>>mutexWaiterShift != 0 &&
atomic.CompareAndSwapInt32(&m.state, old, old|mutexWoken) {
awoke = true
}
runtime_doSpin()
iter++
old = m.state
continue
}
...
}
}
Slow path
的代码量不大,但涉及状态转换很复杂,不容易看懂。这里拆成每个步骤,根据不同场景分析具体源码。
进入
Mutex.lockSlow()
,初始化各个状态位,将当前锁状态赋给变量
old
,进入for循环,执行第一步自旋逻辑。自旋会独占CPU,让CPU空跑,但是减少了频繁切换goroutine带来的内存/时间消耗。如果使用得当,会节省CPU开销,使用不当,会造成CPU浪费。这里进入自旋是很严苛的,通过三个条件判断能否自旋:
- 当前锁是普通模式才能进入自旋。
-
runtime.sync_runtime_canSpin需要返回true:
- 当前goroutine进入自旋的次数小于4次;
- goroutine运行在多CPU的机器上;
- 当前机器上至少存在一个正在运行的处理器P并且处理的运行队列为空;
假设G2可以进入自旋,运行
runtime_doSpin()
:
# src/runtime/lock_futex.go
const active_spin_cnt = 30
# src/runtime/proc.go
//go:linkname sync_runtime_doSpin sync.runtime_doSpin
//go:nosplit
func sync_runtime_doSpin() {
procyield(active_spin_cnt)
}
# src/runtime/asm_amd64.s
TEXT runtime·procyield(SB),NOSPLIT,$0-0
MOVL cycles+0(FP), AX
again:
PAUSE
SUBL $1, AX
JNZ again
RET
自旋实际上是CPU执行了30次PAUSE指令。
自旋是在等待,等待锁释放的过程。假设在自旋期间G1已释放锁,更新
m.state
为0。那么,在G2自旋逻辑中
old = m.state
将更新old为0。继续往下看,for循环中做了什么。
func (m *Mutex) lockSlow() {
...
for {
if old&(mutexLocked|mutexStarving) == mutexLocked && runtime_canSpin(iter) {
...
}
// step2: 更新new,这里new为0
new := old
// step2: 继续更新new
// - 如果锁为普通锁,更新锁状态为已锁。如果锁为饥饿锁,跳过饥饿锁更新。
// - 这里更新锁为1
if old&mutexStarving == 0 {
new |= mutexLocked
}
// step2:继续更新new
// - 如果锁为已锁或饥饿的任何一种,则更新new的goroutine排队等待位
// - 这里锁为已释放,new为1
if old&(mutexLocked|mutexStarving) != 0 {
new += 1 << mutexWaiterShift
}
// step2: 继续更新new
// - 如果goroutine处于饥饿状态,并且当前锁是已锁的,更新new为饥饿状态
// - 这里锁为已释放,new为1
if starving && old&mutexLocked != 0 {
new |= mutexStarving
}
// step2: 继续更新new
// - 如果当前goroutine是唤醒的,重置唤醒位为0
// - goroutine不是唤醒的,new为1
if awoke {
// The goroutine has been woken from sleep,
// so we need to reset the flag in either case.
if new&mutexWoken == 0 {
throw("sync: inconsistent mutex state")
}
new &^= mutexWoken
}
// step3: CAS比较m.state和old,如果一致则更新m.state到new
// - 这里m.state=0,old=0,new=1
// - 更新m.state为new,当前goroutine获得锁
if atomic.CompareAndSwapInt32(&m.state, old, new) {
// 如果更新锁之前的状态不是饥饿或已锁,表示当前goroutine已获得锁,跳出循环。
if old&(mutexLocked|mutexStarving) == 0 {
break // locked the mutex with CAS
}
...
}
}
}
这里将自旋后的逻辑简化为两步,更新锁的期望状态new和通过原子CAS操作更新锁。这里的场景不难,我们可以简化上述流程为如下示意图:
2. 小结
本文介绍了Go互斥锁的基本结构,并且给出一个抢占互斥锁的基本场景,通过场景从源码角度分析互斥锁。