构建 Red Hat 7.9 离线 yum 源¶
使用场景介绍¶
DCE 5.0 预置了 CentOS 7.9,内核为 3.10.0-1160 的 GPU Operator 离线包。其它 OS 类型的节点或内核需要用户手动构建离线 yum 源。
本文介绍如何基于全局服务集群任意节点构建 Red Hat 7.9 离线 yum 源包,并在安装 Gpu Operator 时使用 RepoConfig.ConfigMapName
参数。
前提条件¶
- 用户已经在平台上安装了 v0.12.0 及以上版本的 addon 离线包
- 待部署 GPU Operator 的集群节点 OS 必须为 Red Hat 7.9,且内核版本完全一致
- 准备一个能够与待部署 GPU Operator 的集群网络联通的文件服务器,如 nginx 或 minio
- 准备一个能够访问互联网、待部署 GPU Operator 的集群和文件服务器的节点, 且节点上已经完成 Docker 的安装 5.全局服务集群的节点必须为 Red Hat 7.9
操作步骤¶
1. 构建相关内核版本的离线 Yum 源¶
-
下载与 Kubean 版本对应的的 rhel7.9 ospackage
在 容器管理 的全局服务集群中找到 Helm 应用 ,搜索 kubean,可查看 kubean 的版本号。
在 kubean的代码仓库 中下载该版本的 rhel7.9 ospackage。
-
通过安装器导入离线资源
参考导入离线资源文档。
2. 下载 Red Hat 7.9 OS 的离线驱动镜像¶
3. 向火种节点仓库上传 Red Hat GPU Opreator 离线镜像¶
参考向火种节点仓库上传 Red Hat GPU Opreator 离线镜像。
Note
此参考以 rhel8.4 为例,请注意修改成 rhel7.9。
4. 在集群创建配置项用来保存 Yum 源信息¶
在待部署 GPU Operator 集群的控制节点上运行以下命令。
-
执行如下命令创建名为 CentOS-Base.repo 的文件,用来指定 yum 源存储的配置信息。
# 文件名称必须为 CentOS-Base.repo,否则安装 gpu-operator 时无法被识别 cat > CentOS-Base.repo << EOF [extension-0] baseurl = http://10.5.14.200:9000/centos-base/centos-base # 火种节点的的文件服务器地址,一般为{火种节点 IP} + {9000 端口} gpgcheck = 0 name = kubean extension 0 [extension-1] baseurl = http://10.5.14.200:9000/centos-base/centos-base # 火种节点的的文件服务器地址,一般为{火种节点 IP} + {9000 端口} gpgcheck = 0 name = kubean extension 1 EOF
-
基于创建的 CentOS-Base.repo 文件,在 gpu-operator 命名空间下,创建名为 local-repo-config 的配置文件:
kubectl create configmap local-repo-config -n gpu-operator --from-file=CentOS-Base.repo=/etc/yum.repos.d/extension.repo
预期输出如下:
local-repo-config 配置文件用于在安装 gpu-operator 时,提供
RepoConfig.ConfigMapName
参数的值,配置文件名称用户可自定义。 -
查看 local-repo-config 的配置文件的内容:
预期输出如下:
local-repo-config.yamlapiVersion: v1 data: CentOS-Base.repo: "[extension-0]\nbaseurl = http://10.6.232.5:32618/centos-base # 步骤 2 中,放置 yum 源的文件服务器路径 \ngpgcheck = 0\nname = kubean extension 0\n \n[extension-1]\nbaseurl = http://10.6.232.5:32618/centos-base # 步骤 2 中,放置 yum 源的文件服务器路径 \ngpgcheck = 0\nname = kubean extension 1\n" kind: ConfigMap metadata: creationTimestamp: "2023-10-18T01:59:02Z" name: local-repo-config namespace: gpu-operator resourceVersion: "59445080" uid: c5f0ebab-046f-442c-b932-f9003e014387
至此,您已成功为待部署 GPU Operator 的集群创建了离线 yum 源配置文件。 其中在离线安装 GPU Operator 时使用了 RepoConfig.ConfigMapName
参数。