Ubuntu22.04 离线安装 gpu-operator 驱动
前提条件:已安装 gpu-operator v23.9.0+2 及更高版本
准备离线镜像
- 
查看内核版本 $ uname -r
5.15.0-78-generic
 
- 
查看内核对应的 GPU Driver 镜像版本,
   https://catalog.ngc.nvidia.com/orgs/nvidia/containers/driver/tags。
   使用内核查询镜像版本,通过ctr export保存镜像。
 ctr i pull nvcr.io/nvidia/driver:535-5.15.0-78-generic-ubuntu22.04
ctr i export --all-platforms driver.tar.gz nvcr.io/nvidia/driver:535-5.15.0-78-generic-ubuntu22.04 
 
- 
把镜像导入到火种集群的镜像仓库中 ctr i import driver.tar.gz
ctr i tag nvcr.io/nvidia/driver:535-5.15.0-78-generic-ubuntu22.04 {火种registry}/nvcr.m.daocloud.io/nvidia/driver:535-5.15.0-78-generic-ubuntu22.04
ctr i push {火种registry}/nvcr.m.daocloud.io/nvidia/driver:535-5.15.0-78-generic-ubuntu22.04 --skip-verify=true
 
安装驱动
- 安装 gpu-operator addon
- 若使用预编译模式,则设置 driver.usePrecompiled=true,并设置driver.version=535。
   这里要注意,需要将默认的 535.104.12 改成 535。(非预编译模式跳过此步,直接安装即可)
