Go并发编程：Channel和WaitGroup[译]

📅 2023-07-18 | 🖱️

🔖 go

并发是Go语言的一个强大特性，它允许开发者编写高效且可扩展的应用程序。在Go中，用于管理并发的两种常用机制是Channel和WaitGroup。本文将探讨Channel和WaitGroup之间的相似之处和区别，并讨论何时以及如何有效地使用它们。

1.理解Channel #

Channel是Go并发模型的核心部分，允许Goroutines之间进行通信和同步执行。可以将它们视为带类型的消息队列，可用于在Goroutines之间进行安全通信。

1.1 Channel基础 #

1.1.1 无缓冲Channel #

无缓冲Channel是最简单的Channel形式。当你创建一个无缓冲Channel时，它的容量为零。这意味着每个向Channel发送数据的操作都会阻塞，直到另一个Goroutine准备好接收这个值。同样，每个从Channel接收数据的操作也会阻塞，直到另一个Goroutine准备好发送一个值。

以下是一个示例，演示了无缓冲Channel的行为：

 1package main
 2
 3import (
 4	"fmt"
 5	"time"
 6)
 7
 8func main() {
 9	ch := make(chan int) // 创建一个无缓冲Channel
10
11	go func() {
12		time.Sleep(time.Second) // 模拟一些工作
13		ch <- 5                 // 向Channel发送一个值
14	}()
15
16	x := <-ch      // 从Channel接收值
17	fmt.Println(x) // 输出: 5
18}

在这个例子中，主Goroutine在<-ch这一行阻塞，等待从Channel接收一个值。一旦值被接收，它将被打印到控制台。

无缓冲Channel确保发送者和接收者Goroutine同步。如果发送者在接收者准备好接收之前发送一个值，它将被阻塞，直到接收者准备好。同样地，如果接收者在发送者发送值之前尝试接收一个值，它也将被阻塞，直到发送者准备好。

1.1.2 有缓冲Channel #

相反，有缓冲Channel具有大于零的指定容量。这意味着在阻塞发送操作之前，它们可以容纳一定数量的值。有缓冲Channel将发送者和接收者解耦，允许进行异步通信。

以下是一个示例，演示了有缓冲Channel的行为：

 1package main
 2
 3import "fmt"
 4
 5func main() {
 6	ch := make(chan int, 2) // 创建一个容量为2的有缓冲Channel
 7
 8	ch <- 1 // 向Channel发送值1
 9	ch <- 2 // 向Channel发送值2
10
11	x := <-ch      // 从Channel接收值
12	fmt.Println(x) // 输出：1
13
14	y := <-ch      // 从Channel接收值
15	fmt.Println(y) // 输出：2
16}

在这个例子中，我们按照它们被发送的顺序从Channel接收值。由于Channel有缓冲，它不会阻塞发送操作。

缓冲Channel在发送者和接收者速度不同或者你希望将它们之间的同步解耦时非常有用。它们允许Goroutines发送多个值而无需立即进行同步。

1.1.3 Channel的方向 #

单向Channel

单向Channel限制数据流的方向，只允许发送或接收操作。它们使用箭头（<-）表示数据流的方向来声明。

只发送Channel：发送Channel（chan<- T）只能用于发送类型为T的值。可以访问发送Channel的Goroutine可以向Channel发送值，但它们不能从Channel接收或读取值。发送Channel在你想要限制数据流方向并防止从Channel进行意外读取时非常有用。

 1package main
 2
 3func sendData(ch chan<- int) {
 4	ch <- 5 // 向Channel发送数据
 5}
 6
 7func main() {
 8	ch := make(chan<- int) // 声明一个只发送的Channel
 9
10	go sendData(ch) // 向Channel发送数据
11}

只接收Channel（<-chan T）：只能用于接收类型为T的值。可以访问接收Channel的Goroutine可以从Channel读取值，但它们不能向Channel发送或写入值。接收Channel在你想要限制数据流方向并防止向Channel进行意外写入时非常有用。

 1package main
 2
 3import "fmt"
 4
 5func readData(ch <-chan int) {
 6	x := <-ch // 从Channel接收数据
 7	fmt.Println(x)
 8}
 9
10func main() {
11	ch := make(<-chan int) // 声明一个只接收的Channel
12
13	go readData(ch) // 从Channel接收数据
14}

双向Channel

双向Channel允许发送和接收操作，使数据可以在两个方向上流动。默认情况下，当没有指定方向时，Channel是双向的。

 1package main
 2
 3import (
 4	"fmt"
 5	"time"
 6)
 7
 8func sendData(ch chan int) {
 9	ch <- 42 // 向Channel发送数据
10}
11
12func readData(ch chan int) {
13	x := <-ch // 从Channel接收数据
14	fmt.Println(x)
15}
16
17func main() {
18	ch := make(chan int) // 声明一个双向Channel
19
20	go sendData(ch) // 向Channel发送数据
21	go readData(ch) // 从Channel接收数据
22
23	time.Sleep(time.Second) // 等待Goroutines完成
24}

双向Channel提供了灵活性，因为它们允许在同一个Channel上进行发送和接收操作。它们通常在Goroutines需要在两个方向上进行通信和交换数据时使用。

Channel方向转换

值得注意的是，你可以将双向Channel转换为单向Channel。这种转换允许你将双向Channel赋值给只发送或只接收Channel变量。

 1package main
 2
 3import "fmt"
 4
 5func sendData(ch chan<- int) {
 6	ch <- 42 // 向Channel发送数据
 7}
 8
 9func main() {
10	ch := make(chan int) // 声明一个双向Channel
11
12	sendCh := (chan<- int)(ch) // 转换为只发送的Channel
13	go sendData(sendCh)        // 向Channel发送数据
14
15	readCh := (<-chan int)(ch) // 转换为只接收的Channel
16	x := <-readCh              // 从Channel接收数据
17	fmt.Println(x)
18}

Channel方向转换在你想要将Channel的受限视图传递给函数或将特定Channel方向赋值给变量时非常有用。

单向和双向Channel为管理Goroutines之间的数据流提供了灵活性。通过限制Channel的方向，你可以强制实施正确的通信模式并防止意外的操作。

1.1.4 死锁和阻塞 #

使用Channel时，如果Goroutines被无限期地阻塞，可能会发生死锁。死锁发生在以下情况下：

如果一个Goroutine正在等待向一个无缓冲Channel发送值，但没有接收者来接收该值。

 1package main
 2
 3func main() {
 4    ch := make(chan int) // 创建一个无缓冲Channel
 5
 6    go func() {
 7        ch <- 5 // 向Channel发送一个值
 8    }()
 9
10    // x := <-ch // 从Channel接收值
11
12    // 程序将在这一点上发生死锁，因为发送操作被阻塞
13}

如果一个Goroutine正在等待从无缓冲Channel接收值，但没有发送者来发送该值。

 1package main
 2
 3func main() {
 4    ch := make(chan int) // 创建一个无缓冲Channel
 5
 6    go func() {
 7        // 没有发送者向Channel发送值
 8        <-ch // 从Channel接收值
 9    }()
10
11    // 程序将在这里发生死锁，因为没有发送者发送值
12}

如果一个Goroutine正在等待向一个已满的有缓冲Channel发送值，但没有接收者来接收该值。

 1package main
 2
 3import "fmt"
 4
 5func main() {
 6    ch := make(chan int, 2) // 创建一个容量为2的缓冲Channel
 7
 8    ch <- 1 // 向Channel发送值1
 9    ch <- 2 // 向Channel发送值2
10
11    go func() {
12        ch <- 3 // 尝试向Channel发送值3（Channel已满）
13        fmt.Println("Sent 3 to the channel") // 这行代码永远不会被执行
14    }()
15
16    fmt.Println(<-ch) // 从Channel接收值1
17    fmt.Println(<-ch) // 从Channel接收值2
18}

为了避免死锁，确保在Channel上的发送和接收操作之间进行适当的同步至关重要。可以通过协调Goroutines或使用同步机制（如等待组WaitGroup或超时）来实现这一点。

1.1.5 关闭Channel #

在Go语言中，Channel也可以被关闭，以表示不再发送更多的值。关闭Channel对于向接收方发出所有期望的值的信号非常重要。关闭的Channel仍然可以被接收，但在最后一个值被接收后，它将始终返回零值。

以下是演示关闭Channel的示例：

 1package main
 2
 3import "fmt"
 4
 5func main() {
 6	ch := make(chan int) // 创建一个无缓冲Channel
 7
 8	go func() {
 9		for i := 1; i <= 5; i++ {
10			ch <- i // 向Channel发送值
11		}
12		close(ch) // 在所有值都发送后关闭Channel
13	}()
14
15	for x := range ch {
16		fmt.Println(x) // 输出: 1, 2, 3, 4, 5
17	}
18}

关闭Channel在使用range循环迭代从Channel接收的值时特别有用。它允许接收方知道何时没有更多的值可供接收。

1.1.6 同步 #

Channel的主要优势之一是它们能够同步Goroutines。通过使用Channel，您可以协调多个Goroutines的执行，确保它们完成其工作。

例如，考虑一个场景，您有多个Goroutines执行独立的任务，但是只有在所有Goroutines都完成后才希望处理结果。您可以使用Channel通过创建一个Channel，并让每个Goroutine在完成其工作时向Channel发送一个值来实现此同步。然后，您可以使用一个单独的Goroutine或主Goroutine来等待从Channel接收到的所有预期值。

以下是演示Channel同步的示例：

 1package main
 2
 3import (
 4	"fmt"
 5	"sync"
 6)
 7
 8func worker(id int, ch chan int, wg *sync.WaitGroup) {
 9	defer wg.Done()
10
11	result := id * 2 // 执行一些工作
12
13	ch <- result // 将结果发送到Channel
14}
15
16func main() {
17	numWorkers := 3
18	ch := make(chan int, numWorkers) // 创建一个带缓冲的Channel
19	var wg sync.WaitGroup
20
21	for i := 0; i < numWorkers; i++ {
22		wg.Add(1)
23		go worker(i, ch, &wg)
24	}
25
26	go func() {
27		wg.Wait()
28		close(ch) // 在所有的worker完成后关闭Channel
29	}()
30
31	for result := range ch {
32		fmt.Println(result) // 处理结果
33	}
34}

在这个示例中，我们有多个workder，由worker函数表示。每个worker执行一些工作，并将结果发送到Channel ch。主Goroutine然后使用sync.WaitGroup等待所有worker完成，并关闭Channel。最后，主Goroutine从Channel接收结果并进行处理。

1.1.7 通过Channel传递值 #

通过Channel传递值是Go并发模型中的一个基本概念。通过利用Channel，Goroutines可以高效地交换数据并协调它们的执行。这允许Goroutines无缝地通信和共享信息。Channel可用于建立生产者-消费者关系，其中一个Goroutine生产值并将它们发送到Channel，而另一个Goroutine通过从Channel接收这些值来消费它们。生产者和消费者之间的解耦允许并发执行和高效的数据共享。

以下是演示通过Channel传递值的示例：

 1package main
 2
 3import (
 4	"fmt"
 5	"sync"
 6)
 7
 8func squareWorker(id int, input <-chan int, output chan<- int, wg *sync.WaitGroup) {
 9	defer wg.Done()
10	for num := range input {
11		square := num * num
12		output <- square
13	}
14}
15
16func main() {
17	input := make(chan int)
18	output := make(chan int)
19
20	var wg sync.WaitGroup
21	wg.Add(2)
22
23	go squareWorker(1, input, output, &wg)
24	go squareWorker(2, input, output, &wg)
25
26	go func() {
27		defer close(input)
28		for i := 1; i <= 5; i++ {
29			input <- i
30		}
31	}()
32
33	go func() {
34		defer close(output)
35		wg.Wait()
36	}()
37
38	for square := range output {
39		fmt.Println(square)
40	}
41
42	fmt.Println("All values processed")
43}

我们使用单独的Goroutines同时向输入Channel发送值并从输出Channel读取值。主Goroutine通过等待组wg来等待这些Goroutines的完成。

2.WaitGroup #

WaitGroup（等待组）是Go语言中用于管理并发的机制。它们提供了一种等待一组Goroutines完成它们的执行后再继续执行的方式。

2.1 WaitGroup基础 #

WaitGroup在Go标准库中的sync包中的，它提供了三个基本方法：Add()、Done()和Wait()。

Add()用于添加需要等待的Goroutines的数量。 Done()由每个Goroutine在完成其工作时调用，以递减等待组的内部计数器。 Wait()用于阻塞Goroutine的执行，直到所有Goroutines都调用了Done()。

通过使用Add()增加等待组的计数器，每个Goroutine都会发出需要等待的信号。当Goroutine完成其工作时，它调用Done()来减少等待组的计数器。然后，主Goroutine或其他Goroutine可以调用Wait()来阻塞，直到等待组的计数器达到零。

以下是演示使用等待组的基本示例：

 1package main
 2
 3import (
 4	"errors"
 5	"fmt"
 6	"sync"
 7)
 8
 9func worker(id int, wg *sync.WaitGroup, err *error) {
10	defer wg.Done()
11
12	if id == 2 {
13		*err = errors.New("发生了一个错误") // 模拟可能发生错误的工作
14		return
15	}
16
17	fmt.Println("Worker", id, "已完成")
18}
19
20func main() {
21	numWorkers := 3
22	var wg sync.WaitGroup
23	var err error
24
25	for i := 0; i < numWorkers; i++ {
26		wg.Add(1)
27		go worker(i, &wg, &err)
28	}
29
30	wg.Wait() // 等待所有工作完成
31
32	if err != nil {
33		fmt.Println("发生了一个错误:", err)
34	} else {
35		fmt.Println("所有工作完成")
36	}
37}

在这个例子中，每个workder执行一些工作，在开始工作之前，我们使用wg.Add(1)增加等待组的计数器。每个worker在完成工作后，调用wg.Done()来减少WaitGroup的计数器。最后，主Goroutine调用wg.Wait()来阻塞，直到所有worker都完成，然后继续打印"所有工作完成"。

3.比较Channel和WaitGroup #

现在我们了解了Channel和WaitGroup，让我们在不同方面对它们进行比较。

通信与同步: Channel在促进Goroutine之间的通信方面表现出色。它们提供了一种安全高效的方式来传递数据和同步Goroutine的执行。另一方面，WaitGroup主要专注于同步，确保所有Goroutine在继续之前都已完成。
灵活性: 与WaitGroup相比，Channel提供了更多的灵活性。它们支持各种通信模式，包括单向和双向Channel。这使得在设计并发应用程序时，代码更具表达力。此外，Channel可以处理多个生产者和消费者，使其适用于具有复杂通信需求的场景。
易用性: 对于基本的同步，WaitGroup相对简单易用。它们需要最少的设置，并适用于需要等待固定数量的Goroutine完成的情况。另一方面，Channel需要更明确地管理发送和接收操作，使得设置和使用稍微复杂一些。
错误处理: Channel和WaitGroup在处理错误方面有所不同。通过Channel，每个Goroutine可以通过Channel发送错误值来指示错误。另一方面，WaitGroup依赖于共享错误机制，每个Goroutine在发生错误时更新共享错误变量。这使得主Goroutine可以在所有Goroutine完成后检查错误。

4.选择合适的机制 #

在比较的基础上，选择正确的机制来管理Go应用程序中的并发性至关重要。请考虑问题的性质、通信要求、同步需求和错误处理等因素。

如果需要在运行程序之间进行安全通信，尤其是在传递数据或信号时，请使用Channel。
当需要将发送和接收操作分离，并允许程序在不立即同步的情况下处理多个值时，可使用缓冲Channel。
当需要同步一组执行程序并确保它们在继续之前都完成工作时，可使用WaitGroup。
当需要等待的执行程序数量固定时，可将WaitGroup用于复杂度最低的基本同步方案。

5.总结 #

Channel和WaitGroup都是Go语言中管理并发性的强大工具。Channel促进了goroutines之间的通信，而WaitGroup则专注于同步。了解它们的优缺点有助于您在Go中开发并发应用程序时做出明智的决定。通过选择正确的机制，您可以编写更高效、可扩展的代码，同时发挥 Go并发特性的真正潜力。

原文链接 #

https://emreayberk.medium.com/concurrency-in-go-channels-and-waitgroups-25dd43064d1