NVIDIA Container Toolkit 安装与配置指南

安装准备

  1. 平台兼容性
    请先确认您的平台在官方支持列表中。
  2. NVIDIA显卡驱动
    推荐通过发行版包管理器安装(参考NVIDIA驱动快速安装指南)或使用.run安装程序手动安装。

不同发行版安装方法

基于APT的系统 (Ubuntu/Debian)
# 配置生产环境软件源
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
  && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
    sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
    sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

# (可选)启用实验性软件源
sudo sed -i -e '/experimental/ s/^#//g' /etc/apt/sources.list.d/nvidia-container-toolkit.list

# 更新软件列表并安装
sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
基于DNF的系统 (RHEL/CentOS/Fedora/Amazon Linux)
# 配置生产环境软件源
sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo <<< $(curl -s -L https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo)

# (可选)启用实验性软件源
sudo dnf config-manager --enable nvidia-container-toolkit-experimental

# 安装工具包
sudo dnf install -y nvidia-container-toolkit
基于ZYpp的系统 (OpenSUSE/SLE)
# 添加软件源
sudo zypper ar https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo

# (可选)启用实验性软件源
sudo zypper modifyrepo --enable nvidia-container-toolkit-experimental

# 安装工具包
sudo zypper --gpg-auto-import-keys install -y nvidia-container-toolkit

容器运行时配置

Docker配置
# 配置容器运行时
sudo nvidia-ctk runtime configure --runtime=docker

# 重启Docker服务
sudo systemctl restart docker
Rootless模式配置
# 配置用户级Docker
nvidia-ctk runtime configure --runtime=docker --config=$HOME/.config/docker/daemon.json

# 重启用户级服务
systemctl --user restart docker

# 修改全局配置
sudo nvidia-ctk config --set nvidia-container-cli.no-cgroups --in-place
Containerd配置
# Kubernetes环境配置
sudo nvidia-ctk runtime configure --runtime=containerd
sudo systemctl restart containerd

# nerdctl直接使用(无需额外配置)
nerdctl run --gpus=all <image>
CRI-O配置
sudo nvidia-ctk runtime configure --runtime=crio
sudo systemctl restart crio
Podman配置

推荐使用CDI功能管理NVIDIA设备:

podman run --device nvidia.com/gpu=all <image>

注意事项

  • 所有配置完成后,建议重启相关服务。
  • 实验性软件源可能包含不稳定版本。
  • 完整文档参考官方说明。

原创文章,作者:保哥,如若转载,请注明出处:https://www.shizhanxia.com/2321.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
保哥的头像保哥
上一篇 2025年3月11日 14:34
下一篇 2025年3月21日 15:21

相关推荐

发表回复

登录后才能评论