go select 思想来源于网络IO模型中的 select ,本质上也是 IO多路复用,只不过这里的IO是基于channel而不是基于网络,同时go select 也有一些自己不同的特性,这里简单探讨下。

go select 的特性:

  1. 每个 case 都必须是一个通信
  2. 所有 channel 表达式都会被求值
  3. 所有被发送的表达式都会被求值
  4. 如果任意某个通信可以进行,它就执行;其他被忽略。
  5. 如果有多个case都可以运行,select会 随机公平地 选出一个执行。其他不会执行。否则执行default子句(如果有)
  6. 如果没有 default 字句,select将阻塞,直到某个通信可以运行;Go不会重新对 channel 或值进行求值。

下面通过几个例子来理解这些特性:

select closed/nil channel

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
for {
	select {
	case v1, ok := <-c1:
        // 如果c1被关闭(ok==false),每次从c1读取都会立即返回,将导致死循环
        // 可以通过将c1置为nil来让select ignore掉这个case,继续评估其它case
		if !ok {
			c1 = nil
		}
	}
	
	case v2 := <- c2:
	    // 同样,如果c2被关闭,每次从c1读取都会立即返回对应元素类型的零值(如空字符串),导致死循环
	    // 解决方案仍然是置c2为nil,但是有可能误判(写入方是写入了一个零值而不是关闭channel,比如整数0)
	    
	case c3 <- v3:
	    // 如果c3已经关闭,则panic
	    // 如果c3为nil,则ignore该case	    
}

实现非阻塞读写

结合特性5,6,可以通过带 default 语句的 select 实现非阻塞读写,在实践中还是比较有用的,比如 GS 尝试给玩家推送某条消息,可能并不希望 GS 阻塞在该玩家的 writeChan 上。

1
2
3
4
5
6
select {
    case writeChan <- msg:
        // do something write successed
    default:
        // drop msg, or log err
}

需要注意,一些同学可能将 selectswitch 搞混,习惯先把 default 写好,然后加上外层的 for 循环导致死循环。使用 select 语句, fordefault 基本不会同时出现。

定时任务

结合特性2,每次 select 都会对所有通信表达式求值,因此可通过 time.After 简洁实现定时器功能,并且定时任务可通过 done channel 停止:

1
2
3
4
5
6
7
8
for {
	select {
	case <- time.After(time.Second):
	    // do something per second
	case <- donec:
		return	
	}
}

现在我们稍微变更一下:

1
2
3
4
5
6
7
8
9
donec := make(chan bool, 1)
close(donec)
for {
	select {
	case <- time.After(time.Second):
		fmt.Println("timer")
	case <- donec:
	}
}

现在这段代码会输出什么?还是 panic ?答案是什么也不会,因为:

donec 关闭了,每次都会执行到 case <- donec,并读出零值 false

每次执行 case <- donec1 后, select 再次对 case1 的 timer.After 求值,返回一个新的下一秒超时的 Timer,再次执行到 case <- donec ….

因此,case <- timer.After(time.Second) 不应该解释为每一秒执行一次,而是其它 case 如果有一秒都没有执行,那么就执行这个 case

多个case满足读写条件

结合特性4,如果多个 case 满足读写条件, select 会随机选择一个语句执行:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
func main() {
	ch := make(chan int, 1024)
	go func(ch chan int) {
		for {
			val := <-ch
			fmt.Printf("val:%d\n", val)
		}
	}(ch)
    
	tick := time.NewTicker(1 * time.Second)
	for i := 0; i < 5; i++ {
		select {
		case ch <- i:
		case <-tick.C:
			fmt.Printf("%d: case <-tick.C\n", i)
		}
    
		time.Sleep(500 * time.Millisecond)
	}
	close(ch)
	tick.Stop()
}

输出:

1
2
3
4
5
val:0
val:1
2: case <-tick.C
val:3
4: case <-tick.C

可以看到向 ch 写入的 24 ”不见”了,因为当 tick.Cch 同时满足读写条件时, select 随机选择了一个执行,导致看起来一些数据丢了,其实这个例子是比较极端的,因为向 ch 写入的数据本身就与外部 for 循环计数耦合了,导致依赖于 select 的随机结果(本次没随机到,放到下次,但此时写入的数据已经变更了),因此实际不是数据丢了,而是代码设计时没有考虑到每次 select 只会执行一条读写语句(并且是随机选取的),导致结果不如预期。

总的来说,go select 还是比较容易踩坑的,比如加了不该加的 default ,没有考虑到 channel 关闭的情况,没有理解随机性等等,在使用的时候还是要小心。

Reference