go select机制与常见的坑
go select 思想来源于网络IO模型中的 select ,本质上也是 IO多路复用,只不过这里的IO是基于channel而不是基于网络,同时go select 也有一些自己不同的特性,这里简单探讨下。
go select 的特性:
- 每个
case都必须是一个通信 - 所有
channel表达式都会被求值 - 所有被发送的表达式都会被求值
- 如果任意某个通信可以进行,它就执行;其他被忽略。
- 如果有多个case都可以运行,select会
随机公平地选出一个执行。其他不会执行。否则执行default子句(如果有) - 如果没有
default字句,select将阻塞,直到某个通信可以运行;Go不会重新对channel或值进行求值。
下面通过几个例子来理解这些特性:
select closed/nil channel
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
for {
select {
case v1, ok := <-c1:
// 如果c1被关闭(ok==false),每次从c1读取都会立即返回,将导致死循环
// 可以通过将c1置为nil来让select ignore掉这个case,继续评估其它case
if !ok {
c1 = nil
}
}
case v2 := <- c2:
// 同样,如果c2被关闭,每次从c1读取都会立即返回对应元素类型的零值(如空字符串),导致死循环
// 解决方案仍然是置c2为nil,但是有可能误判(写入方是写入了一个零值而不是关闭channel,比如整数0)
case c3 <- v3:
// 如果c3已经关闭,则panic
// 如果c3为nil,则ignore该case
}
实现非阻塞读写
结合特性5,6,可以通过带 default 语句的 select 实现非阻塞读写,在实践中还是比较有用的,比如 GS 尝试给玩家推送某条消息,可能并不希望 GS 阻塞在该玩家的 writeChan 上。
1
2
3
4
5
6
select {
case writeChan <- msg:
// do something write successed
default:
// drop msg, or log err
}
需要注意,一些同学可能将 select 与 switch 搞混,习惯先把 default 写好,然后加上外层的 for 循环导致死循环。使用 select 语句, for 和 default 基本不会同时出现。
定时任务
结合特性2,每次 select 都会对所有通信表达式求值,因此可通过 time.After 简洁实现定时器功能,并且定时任务可通过 done channel 停止:
1
2
3
4
5
6
7
8
for {
select {
case <- time.After(time.Second):
// do something per second
case <- donec:
return
}
}
现在我们稍微变更一下:
1
2
3
4
5
6
7
8
9
donec := make(chan bool, 1)
close(donec)
for {
select {
case <- time.After(time.Second):
fmt.Println("timer")
case <- donec:
}
}
现在这段代码会输出什么?还是 panic ?答案是什么也不会,因为:
donec 关闭了,每次都会执行到 case <- donec,并读出零值 false
每次执行 case <- donec1 后, select 再次对 case1 的 timer.After 求值,返回一个新的下一秒超时的 Timer,再次执行到 case <- donec ….
因此,case <- timer.After(time.Second) 不应该解释为每一秒执行一次,而是其它 case 如果有一秒都没有执行,那么就执行这个 case 。
多个case满足读写条件
结合特性4,如果多个 case 满足读写条件, select 会随机选择一个语句执行:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
func main() {
ch := make(chan int, 1024)
go func(ch chan int) {
for {
val := <-ch
fmt.Printf("val:%d\n", val)
}
}(ch)
tick := time.NewTicker(1 * time.Second)
for i := 0; i < 5; i++ {
select {
case ch <- i:
case <-tick.C:
fmt.Printf("%d: case <-tick.C\n", i)
}
time.Sleep(500 * time.Millisecond)
}
close(ch)
tick.Stop()
}
输出:
1
2
3
4
5
val:0
val:1
2: case <-tick.C
val:3
4: case <-tick.C
可以看到向 ch 写入的 2 和 4 ”不见”了,因为当 tick.C 和 ch 同时满足读写条件时, select 随机选择了一个执行,导致看起来一些数据丢了,其实这个例子是比较极端的,因为向 ch 写入的数据本身就与外部 for 循环计数耦合了,导致依赖于 select 的随机结果(本次没随机到,放到下次,但此时写入的数据已经变更了),因此实际不是数据丢了,而是代码设计时没有考虑到每次 select 只会执行一条读写语句(并且是随机选取的),导致结果不如预期。
总的来说,go select 还是比较容易踩坑的,比如加了不该加的 default ,没有考虑到 channel 关闭的情况,没有理解随机性等等,在使用的时候还是要小心。
