Linux学习笔记11：管道Pipe到共享内存与信号量

学习目标

理解本节涉及的核心主题：Linux 进程管理、进程间通信（IPC）、管道（Pipe）、命名管道（FIFO）。
能够结合示例完成常见操作，并理解关键参数、使用场景与结果差异。
能够识别本节相关的常见风险、易错点或排查思路。

学习重点

主题范围：Linux 进程管理、进程间通信（IPC）、管道（Pipe）、命名管道（FIFO）、信号（Signals）、消息队列（Message Queues）
学习重点：命令用途、关键参数、典型场景、与相近命令的区别
复习方式：先理解场景，再动手练习，最后对照结果检查

Linux 进程管理

进程间通信（IPC）

管道（Pipe）

定义与用途

**管道（Pipe）**是一种单向的进程间通信机制，允许一个进程将输出传递给另一个进程作为输入。管道通过 | 操作符在命令行中使用，适用于简单的数据传输。

示例场景： 将 ls 命令的输出传递给 grep 命令进行过滤。

示例命令：

ls -l /home/alice | grep ".txt"

解释：

ls -l /home/alice：列出 alice 用户主目录下的所有文件，详细信息。
|：管道符，将前一个命令的输出作为后一个命令的输入。
grep ".txt"：过滤出所有包含 .txt 的行。

输出示例：

-rw-r--r-- 1 alice alice  2048 Apr 27 10:00 notes.txt
-rw-r--r-- 1 alice alice  1024 Apr 27 10:05 todo.txt

创建与使用管道

1. 简单管道示例

将 ps aux 输出传递给 grep 过滤特定进程：

ps aux | grep nginx

输出示例：

root      2001  0.0  0.1  50000  3000 ?        Ss   Apr27   0:00 nginx: master process /usr/sbin/nginx -g daemon on; master_process on;
www-data 2002  0.0  0.2  60000  4000 ?        S    Apr27   0:00 nginx: worker process
www-data 2003  0.0  0.2  60000  4000 ?        S    Apr27   0:00 nginx: worker process

2. 多级管道示例

将多个管道结合，进行复杂的数据处理：

ps aux | grep nginx | awk '{print $2}' | xargs kill

解释：

ps aux：列出所有进程。
grep nginx：过滤出名称包含 nginx 的进程。
awk '{print $2}'：提取进程的 PID。
xargs kill：将 PID 传递给 kill 命令终止进程。

注意事项：

管道的单向性：管道只能传递数据的一个方向，即从左到右。
错误处理：确保管道中每个命令正确执行，避免数据丢失或错误传递。

命名管道（FIFO）

定义与用途

**命名管道（FIFO）**是一种特殊类型的文件，允许无亲缘关系的进程进行通信。不同于匿名管道，命名管道存在于文件系统中，可以在不同终端或进程之间共享。

创建命名管道：

mkfifo /tmp/myfifo

使用命名管道：

进程 A（写入数据）：
```
echo "Hello from A" > /tmp/myfifo
```
进程 B（读取数据）：
```
cat /tmp/myfifo
```

输出：

Hello from A

示例场景：

在两个不同的终端中，使用命名管道实现简单的消息传递。

终端 1：创建命名管道并读取消息

mkfifo /tmp/chatpipe
cat /tmp/chatpipe

终端 2：发送消息

echo "Hello, Terminal 1!" > /tmp/chatpipe

输出（终端 1）：

Hello, Terminal 1!

多个进程使用命名管道

示例：进程间协作

创建命名管道：
```
mkfifo /tmp/data_pipe
```

进程 A（数据生产者）：

for i in {1..5}; do echo "Data $i" > /tmp/data_pipe; sleep 1; done

进程 B（数据消费者）：
```
cat /tmp/data_pipe
```

输出（进程 B）：

Data 1
Data 2
Data 3
Data 4
Data 5

管道的优势与限制

优势：

跨进程通信：允许不同进程之间进行数据交换。
同步机制：生产者和消费者通过管道进行同步，保证数据的有序传递。

限制：

单向传输：管道只能实现单向数据传输，需创建两个管道实现双向通信。
阻塞行为：如果读端未打开，写端会阻塞；同样，写端未写入数据时，读端会阻塞。

解决方法：

使用多级管道或多命名管道：实现复杂的通信需求。
非阻塞 I/O：通过编程实现非阻塞的管道操作。

信号（Signals）

信号的定义与用途

**信号（Signal）**是操作系统用来通知进程某些事件的机制，类似于中断。信号可以用来控制进程的行为，如终止、暂停、重新加载配置等。

常见信号：

信号编号	信号名称	描述
1	SIGHUP	终端挂起信号，常用于重载配置
2	SIGINT	中断信号，通常由 `Ctrl+C`触发
9	SIGKILL	强制终止信号，无法被捕获或忽略
15	SIGTERM	终止信号，请求进程正常终止
17	SIGCHLD	子进程终止信号，通知父进程收尸
19	SIGSTOP	暂停信号，暂停进程执行
20	SIGTSTP	终端停止信号，通常由 `Ctrl+Z`触发
18	SIGCONT	继续执行信号，恢复被暂停的进程

发送与处理信号

发送信号：

使用 kill 命令发送信号：

kill -SIGTERM PID

或使用信号编号：

kill -15 PID

示例：发送 SIGTERM 信号终止 PID 为 1500 的进程

kill -15 1500

处理信号：

进程可以捕获并处理特定信号，通过编程实现自定义行为。常见的处理方式包括清理资源、保存状态、优雅退出等。

示例：Python 脚本捕获 SIGINT 信号

import signal
import sys

def signal_handler(sig, frame):
    print('You pressed Ctrl+C!')
    sys.exit(0)

signal.signal(signal.SIGINT, signal_handler)

print('Press Ctrl+C to exit')
signal.pause()

运行结果：

Press Ctrl+C to exit
You pressed Ctrl+C!

信号的优势与限制

优势：

异步通知：进程可以在任何时间接收到信号，及时响应重要事件。
简洁控制：通过发送信号，可以快速控制进程的行为，无需复杂的 IPC 机制。

限制：

有限的信号类型：信号数量有限，无法传递复杂数据。
潜在的竞态条件：进程在处理信号时可能会进入不一致状态，需谨慎设计信号处理程序。

注意事项：

避免过度使用信号：信号应用于重要事件的通知，避免滥用影响系统稳定性。
确保信号处理的安全性：在编写信号处理程序时，避免执行非异步安全的操作，防止死锁或数据损坏。

信号的应用实例

实例 1：优雅重启服务

向 nginx 发送 SIGHUP 信号，重新加载配置文件，而无需完全重启服务。

sudo kill -SIGHUP $(pgrep nginx)

解释：

pgrep nginx：查找 nginx 进程的 PID。
kill -SIGHUP PID：发送 SIGHUP 信号。

实例 2：终止进程

向一个无响应的进程发送 SIGKILL 信号，强制终止该进程。

kill -9 1500

注意事项：

优先使用 SIGTERM：尝试正常终止进程，给予进程清理资源的机会。
仅在必要时使用 SIGKILL：避免因强制终止进程而导致数据丢失或系统不稳定。

消息队列（Message Queues）

消息队列的定义与用途

**消息队列（Message Queues）**是进程间通信的一种方式，允许进程以消息的形式发送和接收数据，适用于异步通信和任务调度。

主要特点：

有序传输：消息按照发送顺序存储和接收。
缓冲机制：消息队列具有缓冲区，允许发送进程在接收进程未准备好时继续发送。
持久性：消息可以在队列中持久保存，确保在系统重启后仍然可用。

使用场景：

任务调度：将任务消息发送到队列，由消费者进程处理。
数据处理：生产者进程生成数据，消费者进程进行处理。
服务通信：不同服务间通过消息队列进行数据交换和协作。

创建与使用消息队列

使用 POSIX 消息队列：

创建消息队列
使用 mq_open 系统调用创建或打开一个消息队列。
示例：

#include <fcntl.h>
#include <sys/stat.h>
#include <mqueue.h>

mqd_t mq = mq_open("/myqueue", O_CREAT | O_RDWR, 0644, NULL);
if (mq == (mqd_t)-1) {
    perror("mq_open");
    exit(1);
}

发送消息
使用 mq_send 发送消息到队列。
示例：

char msg[] = "Hello, World!";
if (mq_send(mq, msg, sizeof(msg), 0) == -1) {
    perror("mq_send");
    exit(1);
}

接收消息
使用 mq_receive 从队列接收消息。
示例：

char buffer[1024];
if (mq_receive(mq, buffer, 1024, NULL) == -1) {
    perror("mq_receive");
    exit(1);
}
printf("Received: %s\n", buffer);

关闭与删除消息队列
关闭队列并删除：
```
mq_close(mq);
mq_unlink("/myqueue");
```

使用命令行工具：

Linux 提供了 ipcmk, ipcrm, ipcs 等命令管理 System V 消息队列，但 POSIX 消息队列更常用于现代应用程序开发。

注意事项：

权限控制：确保消息队列的访问权限正确，避免未授权访问。
资源管理：及时关闭和删除不再使用的消息队列，避免资源泄露。
消息大小限制：操作系统对消息队列中的消息大小有限制，应根据需求设置合适的缓冲区大小。

消息队列的优势与限制

优势：

异步通信：发送和接收操作可以独立进行，提高系统的并发性。
有序传输：消息按照发送顺序接收，保证数据一致性。
灵活性：支持多个生产者和消费者，适用于复杂的通信场景。

限制：

复杂性：相比简单的管道，消息队列的实现和管理更复杂。
性能开销：消息队列涉及系统调用和内核管理，可能带来性能开销。
消息大小限制：操作系统对消息大小和队列长度有硬性限制。

消息队列的应用实例

实例 1：任务调度系统

生产者进程：发送任务消息到消息队列。

mq_send(mq, "Task 1", sizeof("Task 1"), 0);
mq_send(mq, "Task 2", sizeof("Task 2"), 0);

消费者进程：接收并处理任务消息。

char buffer[1024];
mq_receive(mq, buffer, 1024, NULL);
printf("Processing %s\n", buffer);

实例 2：日志记录服务

应用进程：将日志消息发送到消息队列。
```
echo "User alice logged in" > /dev/mqueue/logqueue
```
日志守护进程：从消息队列接收日志消息并记录到日志文件。
```
mq_receive(mq, buffer, 1024, NULL);
fprintf(logfile, "%s\n", buffer);
```

注意事项：

消息序列化：确保发送和接收的消息格式一致，避免数据解析错误。
错误处理：在发送和接收消息时，处理可能的错误和异常情况。

共享内存与信号量

共享内存（Shared Memory）

定义与用途：

共享内存是一种高效的进程间通信机制，允许多个进程直接访问同一块内存区域，以实现快速数据交换。共享内存适用于需要频繁交换大量数据的场景，如图像处理、数据库系统等。

创建与使用共享内存：

创建共享内存
使用 shm_open 系统调用创建或打开一个共享内存对象。
示例：

#include <fcntl.h>
#include <sys/mman.h>
#include <sys/stat.h>
#include <unistd.h>
#include <stdio.h>
#include <string.h>

int main() {
    int fd = shm_open("/mysharedmem", O_CREAT | O_RDWR, 0666);
    if (fd == -1) {
        perror("shm_open");
        return 1;
    }

    ftruncate(fd, 4096);  // 设置共享内存大小

    void *ptr = mmap(0, 4096, PROT_WRITE, MAP_SHARED, fd, 0);
    if (ptr == MAP_FAILED) {
        perror("mmap");
        return 1;
    }

    strcpy(ptr, "Hello from shared memory!");

    munmap(ptr, 4096);
    close(fd);

    return 0;
}

读取共享内存
另一个进程可以打开并读取共享内存内容。
示例：

#include <fcntl.h>
#include <sys/mman.h>
#include <sys/stat.h>
#include <unistd.h>
#include <stdio.h>

int main() {
    int fd = shm_open("/mysharedmem", O_RDONLY, 0666);
    if (fd == -1) {
        perror("shm_open");
        return 1;
    }

    void *ptr = mmap(0, 4096, PROT_READ, MAP_SHARED, fd, 0);
    if (ptr == MAP_FAILED) {
        perror("mmap");
        return 1;
    }

    printf("Shared Memory Content: %s\n", (char *)ptr);

    munmap(ptr, 4096);
    close(fd);

    return 0;
}

注意事项：

同步机制：共享内存本身不提供同步机制，需要结合信号量或其他 IPC 方式实现进程间同步。
权限控制：确保共享内存对象的访问权限设置正确，避免未授权访问。

信号量（Semaphores）

定义与用途：

信号量是一种用于进程间同步和互斥的机制，防止多个进程同时访问共享资源，避免竞争条件和数据不一致。

使用信号量进行同步：

创建信号量
使用 sem_open 创建或打开一个信号量。
示例：

#include <semaphore.h>
#include <fcntl.h>
#include <stdio.h>

int main() {
    sem_t *sem = sem_open("/mysemaphore", O_CREAT, 0644, 1);
    if (sem == SEM_FAILED) {
        perror("sem_open");
        return 1;
    }

    // 等待信号量
    sem_wait(sem);

    // 访问共享资源
    printf("Accessing shared resource...\n");

    // 释放信号量
    sem_post(sem);

    sem_close(sem);
    sem_unlink("/mysemaphore");

    return 0;
}

注意事项：

避免死锁：确保进程在获取信号量后，最终能够释放信号量，防止死锁情况。
资源清理：在不再使用信号量时，及时关闭和删除信号量对象，释放系统资源。

共享内存与信号量的结合使用

结合共享内存和信号量，可以实现高效和安全的进程间通信。

示例：生产者-消费者问题

生产者进程
- 获取信号量，写入数据到共享内存。
- 释放信号量。
消费者进程
- 获取信号量，读取数据从共享内存。
- 释放信号量。

生产者代码示例：

#include <stdio.h>
#include <stdlib.h>
#include <fcntl.h>
#include <sys/mman.h>
#include <semaphore.h>
#include <unistd.h>
#include <string.h>

int main() {
    // 打开共享内存
    int fd = shm_open("/mysharedmem", O_CREAT | O_RDWR, 0666);
    ftruncate(fd, 4096);
    void *ptr = mmap(0, 4096, PROT_WRITE, MAP_SHARED, fd, 0);

    // 打开信号量
    sem_t *sem = sem_open("/mysemaphore", O_CREAT, 0644, 1);

    // 写入数据
    sem_wait(sem);
    strcpy(ptr, "Data from producer");
    sem_post(sem);

    // 清理
    munmap(ptr, 4096);
    close(fd);
    sem_close(sem);

    return 0;
}

消费者代码示例：

#include <stdio.h>
#include <stdlib.h>
#include <fcntl.h>
#include <sys/mman.h>
#include <semaphore.h>
#include <unistd.h>

int main() {
    // 打开共享内存
    int fd = shm_open("/mysharedmem", O_RDONLY, 0666);
    void *ptr = mmap(0, 4096, PROT_READ, MAP_SHARED, fd, 0);

    // 打开信号量
    sem_t *sem = sem_open("/mysemaphore", 0);

    // 读取数据
    sem_wait(sem);
    printf("Consumer read: %s\n", (char *)ptr);
    sem_post(sem);

    // 清理
    munmap(ptr, 4096);
    close(fd);
    sem_close(sem);
    sem_unlink("/mysemaphore");
    shm_unlink("/mysharedmem");

    return 0;
}

运行流程：

运行生产者进程，写入数据到共享内存。
运行消费者进程，读取数据从共享内存。

输出（消费者）：

Consumer read: Data from producer

注意事项：

同步机制：确保生产者和消费者正确使用信号量进行同步，避免数据竞争和不一致。
资源管理：在进程结束后，及时关闭和删除共享内存和信号量对象。

信号量的优势与限制

优势：

有效同步：确保多个进程按预定顺序访问共享资源。
简单互斥：通过信号量实现进程间的互斥访问，防止数据竞争。

限制：

复杂性增加：在复杂的通信场景中，管理信号量和共享内存的同步逻辑可能较为复杂。
资源消耗：信号量和共享内存需要系统资源支持，过度使用可能影响系统性能。

最佳实践：

合理设计同步机制：根据应用需求，选择合适的 IPC 方式和同步策略。
错误处理：在使用信号量和共享内存时，处理可能的错误和异常情况，确保系统稳定性。

本节总结

本节主要围绕 Linux 进程管理、进程间通信（IPC）、管道（Pipe）、命名管道（FIFO）、信号（Signals）展开。
学习时应优先抓住「命令解决什么问题、在什么场景下使用、执行后会产生什么结果」。
对涉及权限、覆盖、网络、系统服务、删除或安全配置的操作，建议先在测试环境练习。

复习建议

先用自己的话复述本节每个主题或命令的作用，避免只记参数不懂用途。
按原文示例至少手敲一遍典型命令，并观察输出变化。
对高风险操作先确认路径、权限和目标对象，再执行实际命令。

2026 年 7 月
日	一	二	三	四	五	六
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31