--- name: paddle-build description: Use when needing to compile, rebuild, or install Paddle from source after code changes. Covers cmake configuration, ninja incremental build, wheel packaging, and common build failure diagnosis. --- # Paddle 源码编译 ## 概览 Paddle 使用 CMake + Ninja 构建。典型流程：cmake 配置 → ninja 编译 → whl 打包安装。修改 C++/CUDA 代码后需重新编译才能生效。 ## 编译流程 ### 1. 环境准备（venv） ```bash cd /workspace/Paddle uv venv --relocatable --seed --python 3.10 # 首次创建 source .venv/bin/activate uv pip install -r python/requirements.txt uv pip install func_timeout pandas numpy "numpy<2.0" ``` 若 `.venv` 已存在，直接 `source .venv/bin/activate` 即可。 ### 2. CMake 配置 ```bash mkdir -p build && cd build cmake .. \ -GNinja \ -DCMAKE_BUILD_TYPE=Release \ -DCMAKE_EXPORT_COMPILE_COMMANDS=ON \ -DPY_VERSION=3.10 \ -DPADDLE_VERSION=0.0.0 \ -DCUDA_ARCH_NAME=Auto \ -DWITH_GPU=ON \ -DWITH_DISTRIBUTE=ON \ -DWITH_CINN=ON \ -DWITH_UNITY_BUILD=OFF \ -DWITH_TESTING=OFF ``` 配置只需首次执行或 CMake 选项变更时重新执行。 ### 3. 编译 ```bash ninja -j$(nproc) ``` Ninja 自动增量编译，仅重编变更文件及其依赖。 ### 4. 安装 ```bash cd /workspace/Paddle uv pip install build/python/dist/*.whl --no-deps --force-reinstall ``` `--no-deps` 跳过依赖解析加速安装，`--force-reinstall` 确保覆盖旧版。 ## 常用 CMake 选项 | 选项 | 默认 | 说明 | |------|------|------| | `WITH_GPU` | ON(有CUDA时) | GPU 支持 | | `WITH_DISTRIBUTE` | OFF | 分布式训练 | | `WITH_CINN` | OFF | CINN 编译器 | | `WITH_TESTING` | ON | C++ 单测（关闭可加速编译） | | `WITH_UNITY_BUILD` | OFF | 合并编译单元加速（可能掩盖头文件问题） | | `CUDA_ARCH_NAME` | Auto | GPU 架构，Auto 自动检测当前卡 | | `CMAKE_BUILD_TYPE` | Release | Debug 可调试但更慢 | | `CMAKE_EXPORT_COMPILE_COMMANDS` | OFF | 生成 `compile_commands.json` 供 clangd 使用 | | `WITH_TENSORRT` | OFF | TensorRT 推理加速 | | `WITH_ROCM` | OFF | AMD ROCm 支持 | | `WITH_XPU` | OFF | 百度昆仑 XPU 支持 | ## 增量编译策略 ```dot digraph incremental { "修改了什么?" [shape=diamond]; "Python 代码" [shape=box, label="无需编译\n同步源码到构建目录后测试"]; "C++/CUDA kernel" [shape=box, label="ninja → 安装 whl"]; "CMakeLists / cmake 选项" [shape=box, label="重新 cmake → ninja → 安装 whl"]; "YAML (ops/backward)" [shape=box, label="ninja（触发代码生成）→ 安装 whl"]; "修改了什么?" -> "Python 代码" [label="python/"]; "修改了什么?" -> "C++/CUDA kernel" [label="paddle/phi/"]; "修改了什么?" -> "CMakeLists / cmake 选项" [label="cmake/"]; "修改了什么?" -> "YAML (ops/backward)" [label="ops.yaml 等"]; } ``` - **仅改 Python**：无需编译。如果直接在 `build/python` 下编辑测试，改动即时生效。也可以在源码目录编辑后通过 `cp python/ build/python/` 或者 `cp test/ build/test/` 同步到构建目录。 - **改 C++/CUDA**：`cd build && ninja -j$(nproc)` + 重新安装 whl。 - **改 CMake 配置**：需重新 `cmake ..` 再 `ninja`。 - **改 YAML（ops.yaml / backward.yaml）**：ninja 会自动触发代码生成脚本。 ## 检查已有构建产物复用已有 build 可大幅节约时间： ```bash # 检查是否已有 whl ls build/python/dist/*.whl 2>/dev/null && echo "已有构建产物" || echo "需要编译" # 检查 compile_commands.json（clangd 需要） ls build/compile_commands.json 2>/dev/null ``` ## 常见编译问题 | 症状 | 原因 | 解决 | |------|------|------| | `ninja: error: loading 'build.ninja'` | 未执行 cmake 配置 | 先执行 cmake 命令 | | CUDA arch 不匹配 | `CUDA_ARCH_NAME` 与实际 GPU 不符 | 设为 `Auto` 或指定具体架构 | | 链接时 OOM | 并行链接占用过多内存 | `ninja -j4` 减少并行度 | | protobuf 版本冲突 | 系统 protobuf 与编译版本不一致 | 在 venv 内编译，隔离系统包 | | `ccache` 缓存失效导致全量重编 | 头文件路径变更 | 清理 ccache: `ccache -C` | | whl 安装后 import 报错 | 旧 .so 残留 | `--force-reinstall` 或清理 `site-packages/paddle` | ## 完整一键编译示例 ```bash cd /workspace/Paddle source .venv/bin/activate cd build ninja -j$(nproc) && cd .. && uv pip install build/python/dist/*.whl --no-deps --force-reinstall ``` ## 调试编译（Debug 模式）需要 gdb 调试 C++ 代码时，将 `CMAKE_BUILD_TYPE` 改为 `Debug`： ```bash cmake .. -GNinja -DCMAKE_BUILD_TYPE=Debug [其他选项...] ninja -j$(nproc) ``` Debug 模式编译产物更大、运行更慢，仅在需要调试时使用。 ## 关键目录 | 目录 | 说明 | |------|------| | `build/` | 构建产物根目录 | | `build/python/dist/` | 生成的 whl 文件 | | `build/compile_commands.json` | clangd 索引文件 | | `paddle/phi/kernels/` | PHI kernel 源码 | | `paddle/phi/ops/yaml/` | 算子 YAML 定义 | | `cmake/` | CMake 模块和工具链 | ## 平台特定指南 | 平台 | 参考文档 | |------|---------| | macOS (Apple Silicon) CPU 编译 | [references/mac-build.md](references/mac-build.md) |