安装准备
- 平台兼容性:
请先确认您的平台在官方支持列表中。 - NVIDIA显卡驱动:
推荐通过发行版包管理器安装(参考NVIDIA驱动快速安装指南)或使用.run
安装程序手动安装。
不同发行版安装方法
基于APT的系统 (Ubuntu/Debian)
# 配置生产环境软件源
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
&& curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
# (可选)启用实验性软件源
sudo sed -i -e '/experimental/ s/^#//g' /etc/apt/sources.list.d/nvidia-container-toolkit.list
# 更新软件列表并安装
sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
基于DNF的系统 (RHEL/CentOS/Fedora/Amazon Linux)
# 配置生产环境软件源
sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo <<< $(curl -s -L https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo)
# (可选)启用实验性软件源
sudo dnf config-manager --enable nvidia-container-toolkit-experimental
# 安装工具包
sudo dnf install -y nvidia-container-toolkit
基于ZYpp的系统 (OpenSUSE/SLE)
# 添加软件源
sudo zypper ar https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo
# (可选)启用实验性软件源
sudo zypper modifyrepo --enable nvidia-container-toolkit-experimental
# 安装工具包
sudo zypper --gpg-auto-import-keys install -y nvidia-container-toolkit
容器运行时配置
Docker配置
# 配置容器运行时
sudo nvidia-ctk runtime configure --runtime=docker
# 重启Docker服务
sudo systemctl restart docker
Rootless模式配置
# 配置用户级Docker
nvidia-ctk runtime configure --runtime=docker --config=$HOME/.config/docker/daemon.json
# 重启用户级服务
systemctl --user restart docker
# 修改全局配置
sudo nvidia-ctk config --set nvidia-container-cli.no-cgroups --in-place
Containerd配置
# Kubernetes环境配置
sudo nvidia-ctk runtime configure --runtime=containerd
sudo systemctl restart containerd
# nerdctl直接使用(无需额外配置)
nerdctl run --gpus=all <image>
CRI-O配置
sudo nvidia-ctk runtime configure --runtime=crio
sudo systemctl restart crio
Podman配置
推荐使用CDI功能管理NVIDIA设备:
podman run --device nvidia.com/gpu=all <image>
注意事项
- 所有配置完成后,建议重启相关服务。
- 实验性软件源可能包含不稳定版本。
- 完整文档参考官方说明。
原创文章,作者:保哥,如若转载,请注明出处:https://www.shizhanxia.com/2321.html