Linux程序是如何被系统执行的呢？

Linux程序的执行是一个涉及编译、链接、加载和运行的多阶段过程，从源代码到最终执行，需要操作系统、编译器和加载器的协同工作，下面将详细拆解这一流程。

从源码到可执行文件：编译与链接

Linux程序通常以高级语言（如C、C++）源码形式存在，需通过编译器转换为机器可识别的二进制指令，这一过程分为四个阶段，以C语言为例：

预处理：预处理器（如gcc的-E选项）处理源码中的宏定义（#define）、头文件包含（#include）和条件编译指令（#ifdef），生成.i文件。#include <stdio.h>会被替换为stdio.h的实际内容，宏展开后得到纯代码。
编译：编译器（gcc -S）将预处理后的代码转换为汇编语言（.s文件），这一阶段进行语法分析、语义分析，生成对应CPU架构的汇编指令，如x86的mov、add等。
汇编：汇编器（gcc -c）将汇编代码转换为机器码，生成目标文件（.o文件），目标文件包含代码段（text section）、数据段（data section）和符号表（记录函数/变量的地址信息）。
链接：链接器（ld）将多个目标文件和库文件（如标准库libc）合并为一个可执行文件（ELF格式），链接过程包括：合并代码段和数据段、解析符号（如printf函数的地址指向libc中的实现）、重定位（修正代码中的地址引用），若程序调用了printf，链接器会将printf的地址替换为libc中该函数的实际入口地址。

以下是编译链接步骤的总结表格：

Linux可执行文件采用ELF（Executable and Linkable Format）格式，包含程序头表（描述如何加载到内存）和节区头表（描述文件内部结构），当用户执行程序时（如./hello），内核通过以下步骤加载：

系统调用：shell解析命令后，通过fork创建子进程，子进程调用exec系列系统调用（如execve），将可执行文件加载到内存。
解析ELF：内核读取ELF文件的魔数（0x7F ELF）验证格式，通过程序头表找到需要加载的段（如代码段.text、数据段.data），并将这些段映射到进程的虚拟内存空间。
内存映射：内核为程序分配虚拟内存，设置页表映射物理内存，代码段通常映射为只读（防止被修改），数据段可读写，BSS段（未初始化全局变量）会被清零。
设置环境：内核初始化进程的堆栈（stack），将命令行参数（argc/argv）和环境变量压入栈中，然后跳转到ELF文件指定的入口点（如_start，由链接器生成）。

入口点_start是链接器生成的启动代码,完成以下工作后跳转到main函数：

初始化：设置C运行时环境（如初始化全局变量、调用库初始化函数）。
调用main：将命令行参数和环境变量传递给main函数，然后执行main函数的代码。
执行与终止：程序运行时，CPU逐条执行机器码，通过函数调用栈管理函数调用（如调用malloc时，堆栈会增长），程序正常执行到main返回，或通过exit/return终止，内核回收进程资源（如内存、文件描述符）。

若程序依赖动态库（如libc），加载器在运行时会进行动态链接：