061. 理解内存对齐和字节序

在C语言中，内存对齐和字节序是两个非常重要的概念，它们直接影响到程序的性能和可移植性。理解这两个概念对于编写高效、可靠的C代码至关重要。

1. 内存对齐（Memory Alignment）

内存对齐是指数据在内存中的存储位置必须满足特定的对齐要求。不同的数据类型通常有不同的对齐要求，例如：

char 类型通常对齐到1字节边界。
int 类型通常对齐到4字节边界。
double 类型通常对齐到8字节边界。

1.1 为什么要内存对齐？

提高访问效率：现代计算机的内存访问通常以块为单位，对齐的数据可以减少内存访问次数，提高访问效率。例如，访问一个4字节对齐的 int 类型变量，通常只需要一次内存访问；而如果它未对齐，可能需要多次访问并进行组合。
硬件要求：某些硬件平台要求数据必须对齐，否则会引发错误或异常。

1.2 如何实现内存对齐？

C语言中，编译器通常会自动处理内存对齐，但也可以通过编译器指令或属性来控制对齐方式。

#include <stdio.h>

// 定义一个结构体
struct Example {
    char a;        // 1字节
    int b;         // 4字节
    double c;      // 8字节
};

int main() {
    struct Example ex;
    printf("Size of struct Example: %lu bytes\n", sizeof(struct Example));
    printf("Offset of 'a': %lu bytes\n", (unsigned long)&ex.a - (unsigned long)&ex);
    printf("Offset of 'b': %lu bytes\n", (unsigned long)&ex.b - (unsigned long)&ex);
    printf("Offset of 'c': %lu bytes\n", (unsigned long)&ex.c - (unsigned long)&ex);
    return 0;
}

输出可能如下：

Size of struct Example: 16 bytes
Offset of 'a': 0 bytes
Offset of 'b': 4 bytes
Offset of 'c': 8 bytes

1.3 控制内存对齐

可以通过编译器指令或属性来控制内存对齐。例如，使用GCC的 __attribute__((packed))：

struct Example {
    char a;
    int b;
    double c;
} __attribute__((packed));

使用 packed 属性后，结构体的大小将变为13字节（char + int + double），但可能会降低访问效率。

2. 字节序（Byte Order）

字节序是指多字节数据在内存中的存储顺序。常见的字节序有两种：

大端序（Big-Endian）：最高有效字节（MSB）存储在最低地址。
小端序（Little-Endian）：最低有效字节（LSB）存储在最低地址。

2.1 为什么要了解字节序？

跨平台数据交换：不同的平台可能使用不同的字节序，因此在跨平台传输数据时需要进行字节序转换。
网络协议：网络协议（如TCP/IP）通常使用大端序，因此在处理网络数据时需要进行字节序转换。

2.2 如何确定当前平台的字节序？

可以通过以下代码确定当前平台的字节序：

#include <stdio.h>

int isLittleEndian() {
    unsigned int x = 1;
    return !((char*)&x)[0];
}

int main() {
    if (isLittleEndian()) {
        printf("当前平台使用小端序（Little-Endian）\n");
    } else {
        printf("当前平台使用大端序（Big-Endian）\n");
    }
    return 0;
}

2.3 字节序转换

可以通过以下函数进行字节序转换：

#include <stdint.h>

// 将小端序转换为大端序
uint16_t swapEndian16(uint16_t value) {
    return (value >> 8) | (value << 8);
}

// 将小端序转换为大端序
uint32_t swapEndian32(uint32_t value) {
    return ((value >> 24) & 0x000000FF) |
           ((value >> 8)  & 0x0000FF00) |
           ((value << 8)  & 0x00FF0000) |
           ((value << 24) & 0xFF000000);
}

int main() {
    uint16_t value16 = 0x1234;
    uint32_t value32 = 0x12345678;

    printf("原始16位值: 0x%X\n", value16);
    printf("转换后16位值: 0x%X\n", swapEndian16(value16));

    printf("原始32位值: 0x%X\n", value32);
    printf("转换后32位值: 0x%X\n", swapEndian32(value32));

    return 0;
}

示例运行

输入：

无输入

输出：

当前平台使用小端序（Little-Endian）
原始16位值: 0x1234
转换后16位值: 0x3412
原始32位值: 0x12345678
转换后32位值: 0x78563412

总结

内存对齐：

内存对齐可以提高访问效率，减少内存访问次数。
编译器通常会自动处理内存对齐，但可以通过编译器指令或属性进行控制。

字节序：

字节序影响多字节数据在内存中的存储顺序。
不同平台可能使用不同的字节序，因此在跨平台数据交换时需要进行字节序转换。

通过理解内存对齐和字节序，可以编写出更高效、更可移植的C代码。

视频讲解

BiliBili： 视睿网络-哔哩哔哩视频 (bilibili.com)