指标弹性伸缩(HPA)¶
DaoCloud Enterprise 5.0 支持 Pod 资源基于指标进行弹性伸缩(Horizontal Pod Autoscaling, HPA)。 用户可以通过设置 CPU 利用率、内存用量及自定义指标指标来动态调整 Pod 资源的副本数量。 例如,为工作负载设置基于 CPU 利用率指标弹性伸缩策略后,当 Pod 的 CPU 利用率超过/低于您设置的指标阀值,工作负载控制器将会自动增加/较少 Pod 副本数。
本文将介绍如何为工作负载配置基于内置指标和自定义指标的弹性伸缩。
Note
- HPA 仅适用于 Deployment 和 StatefulSet,每个工作负载只能创建一个 HPA。
- 如果基于 CPU 利用率创建 HPA 策略,必须预先为工作负载设置配置限制(Limit),否则无法计算 CPU 利用率。
- 如果同时使用内置指标和多种自定义指,HPA 会根据多项指标分别计算所需伸缩副本数,取较大值(但不会超过设置 HPA 策略时配置的最大副本数)进行弹性伸缩。
内置指标弹性伸缩策略¶
系统内置了 CPU 和内存两种弹性伸缩指标以满足用户的基础业务使用场景。
前提条件¶
在为工作负载配置内置指标弹性伸缩策略之前,需要满足以下前提条件:
-
容器管理模块已接入 Kubernetes 集群或者已创建 Kubernetes 集群,且能够访问集群的 UI 界面。
-
已完成一个命名空间的创建、无状态工作负载的创建或有状态工作负载的创建。
操作步骤¶
参考以下步骤,为工作负载配置内置指标弹性伸缩策略。
-
点击左侧导航栏上的
集群列表
进入集群列表页面。点击一个集群名称,进入集群详情
页面。 -
在集群详情页面,点击左侧导航栏的
工作负载
进入工作负载列表后,点击一个负载名称,进入工作负载详情
页面。 -
点击
弹性伸缩
页签,查看当前集群的弹性伸缩配置情况。 -
确认集群已安装了
metrics-server
插件,且插件运行状态为正常后,即可点击新建伸缩
按钮。 -
创建自定义指标弹性伸缩策略参数。
- 策略名称:输入弹性伸缩策略的名称,请注意名称最长 63 个字符,只能包含小写字母、数字及分隔符(“-”),且必须以小写字母或数字开头及结尾,例如 hpa-my-dep。
- 命名空间:负载所在的命名空间。
- 工作负载:执行弹性伸缩的工作负载对象。
- 目标 CPU 利用率:工作负载资源下 Pod 的 CPU 使用率。计算方式为:工作负载下所有的 Pod 资源 / 工作负载的请求(request)值。当实际 CPU 用量大于/小于目标值时,系统自动减少/增加 Pod 副本数量。
- 目标内存用量:工作负载资源下的 Pod 的内存用量。当实际内存用量大于/小于目标值时,系统自动减少/增加 Pod 副本数量。
- 副本范围:Pod 副本数的弹性伸缩范围。默认区间为为 1 - 10。
-
完成参数配置后,点击
确定
按钮,自动返回弹性伸缩详情页面。点击列表右侧的⋮
,可以执行编辑、删除操作,还可以查看相关事件。
自定义指标弹性伸缩策略¶
当系统内置的 CPU 和内存两种指标不能够满足您业务的实际需求时,您可以通过配置 ServiceMonitoring 来添加自定义指标,并基于自定义指标实现弹性伸缩。
前提条件¶
在为工作负载配置自定义指标弹性伸缩策略之前,需要满足以下前提条件:
-
容器管理模块已接入 Kubernetes 集群或者已创建 Kubernetes 集群,且能够访问集群的 UI 界面。
-
已完成一个命名空间的创建、无状态工作负载的创建或有状态工作负载的创建。
- 已完成 Insight 插件的安装。
- 已完成 Prometheus-adapter 插件的安装。
操作步骤¶
参考以下步骤,为工作负载配置指标弹性伸缩策略。
-
点击左侧导航栏上的
集群列表
进入集群列表页面。点击一个集群名称,进入集群详情
页面。 -
在集群详情页面,点击左侧导航栏的
工作负载
进入工作负载列表后,点击一个负载名称,进入工作负载详情
页面。 -
点击
弹性伸缩
页签,查看当前集群的弹性伸缩配置情况。 -
确认集群已安装了
metrics-server
、Insight、Prometheus-adapter 插件且插件运行状态为正常后,即可点击新建伸缩
按钮。Note
如果相关插件未安装或插件处于异常状态,您在页面上将无法看见创建自定义指标弹性伸缩入口。
-
创建自定义指标弹性伸缩策略参数。
- 策略名称:输入弹性伸缩策略的名称,请注意名称最长 63 个字符,只能包含小写字母、数字及分隔符(“-”),且必须以小写字母或数字开头及结尾,例如 hpa-my-dep。
- 命名空间:负载所在的命名空间。
- 工作负载:执行弹性伸缩的工作负载对象。
- 资源类型:进行监控的自定义指标类型,包含 Pod 和 Service 两种类型。
- 指标:使用 ServiceMonitoring 创建的自定义指标名称或系统内置的自定义指标名称。
- 数据类型:用于计算指标值的方法,包含目标值和目标平均值两种类型,当资源类型为 Pod 时,只支持使用目标平均值。