跳转至

服务监控

可观测性 Insight 中服务是指使用 Opentelemtry SDK 接入链路数据,服务监控能够辅助运维过程中观察应用程序的性能和状态。

如何使用 OpenTelemetry 请参考:使用 OTel 赋予应用可观测性

名词解释

  • 服务:服务表示为传入请求提供相同行为的一组工作负载。您可以在使用 OpenTelemetry SDK 时定义服务名称或使用 Istio 中定义的名称。
  • 操作:操作是指一个服务处理的特定请求或操作,每个 Span 都有一个操作名称。
  • 出口流量:出口流量是指当前服务发起请求的所有流量。
  • 入口流量:入口流量是指上游服务对当前服务发起请求的所有流量。

服务列表

服务列表页面展示了集群中所有已接入链路数据的服务的吞吐率、错误率、请求延时等关键指标。 您可以根据集群、命名空间对服务进行过滤,也可以按照吞吐率、错误率、请求延时对该列表进行排序。列表中的指标数据默认时间为 1 小时,您可以自定义时间范围。

请按照以下步骤查看服务监控指标:

  1. 进入可观测性 产品模块,
  2. 在左边导航栏选择 场景监控 -> 服务监控

    服务监控

Attention

若列表中服务所在的命名空间为_unknown 时,则表示该服务未规范接入,建议重新接入。 如您接入的服务存在同名且均未正确填写环境变量中的命名空间时,列表及服务详情页中展示的监控数据为多个服务的汇总数据。

服务详情

点击服务名(以 ghippo-keycloakx 为例),点击进入服务详情页,查看服务的详细指标和该服务的操作指标。

流量指标

在流量指标模块,您可查看到该服务默认一小时内全部请求(包含入口流量和出口流量)的监控指标。您可切换右上角的时间选择器快速选择时间范围,或自定义时间范围。同时,可选择单独查看该服务的入口请求的监控指标或出口请求的流量指标。

服务监控

操作指标

在操作指标模块,您可查看该服务各个操作的操作指标。

服务指标说明

参数 说明
吞吐率 单位时间内处理请求的数量。
错误率 查询时间范围内错误请求与请求总数的比值。
请求延时 单位时间内服务请求的平均响应时间。

评论