跳转至

常见术语

本页面列出了一些有关可观测性 (Insight) 的常见术语。

  • Alert(告警)

    告警是 Insight 主动触发告警规则后的结果。告警从 Insight 发送到 Alertmanager。

  • Alert rules(告警规则)

    一个返回值是布尔值的 PromQL 表达式,它描述了指标或自定义指标是否处于阈值范围中,如果不满足将产生一条告警事件。

  • Alertmanager(告警管理器)

    Alertmanager 接收告警,将其聚合分组,消除重复的告警,再应用一些策略后,通过电子邮件、企业微信、钉钉等向用户发送告警信息。

  • Client Library(客户端库)

    为需要监控的服务生成相应的 metrics 并暴露给 Insight server。当 Insight server 来 pull 时,将直接返回实时状态的指标。

  • Collector(收集器)

    收集器是由一组指标定义的 exporter 的组成部分。如果是直接检测(Direct instrumentation)的一部分,那么可能是一个指标;如果是从另一个系统拉取的指标,那么可能是多个指标。

  • Dashboard(仪表盘)

    仪表盘是可视化管理的一种表现形式,即对数据、情报等状况一目了然的表现,它通过形象直观而又色彩适宜的各种视觉感知来展示信息。通过可视化图形展示平台的实时情况和 DCE 中所有的性能指标。

  • Endpoint(端点)

    一种可被刮取指标的数据源,通常对应于单个进程。

  • Event(告警消息)

    告警规则被触发时的记录信息,记录了告警规则、触发时间、当前系统状态;同时将触发相应的动作,例如发送邮件。

  • Exporter

    一个能够提供指标的服务,往往被理解为监控对象。Exporter 将现有第三方服务的指标暴露给 Insight。Exporter 是随着获取指标的应用程序运行的二进制文件,将非 Insight 格式的指标暴露为 Insight 支持的格式。

  • Metrics(指标)

    使用 open-metric 格式描述,衡量软件或硬件系统中某种属性的程度的标准。对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。有关更多信息,参见指标类型

  • Log(日志)

    系统运行过程中变化的一种抽象数据,其内容为指定对象的操作及其操作结果按时间的有序集合。

  • Trace(链路)

    记录单次请求范围内的处理信息,其中包括服务调用和处理时长等数据。

  • Instance(实例)

    实例是一个标签,唯一标识 job 中的某个目标。

  • Job(任务)

    这是具有相同用途的目标任务集合,例如为可扩展性或可靠性而复制的一组类似进程。有关更多信息,参见任务和实例

  • Metrics(指标)

    使用 open-metric 格式描述,衡量软件或硬件系统中某种属性的程度的标准。对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。有关更多信息,参见指标类型

  • Notification(通知)

    由系统通过邮件等渠道发送给用户的告警事件信息。通知是一个或多个告警形成的消息组,通过 Alertmanager 发送电子邮件、企业微信或钉钉消息。

  • PromQL

    这是 Insight 内置的数据查询语言,提供了对时间序列数据的丰富查询功能,支持聚合和逻辑运算能力。有关更多信息,参见数据查询语言

  • Pushgateway

    Pushgateway 保存来自批处理作业的最新指标推送。这使得 Insight 可以在终止后刮取指标。

  • Recording Rule(自定义指标)

    一个被命名的 PromQL 表达式,这是将多个指标通过计算而得到的新指标,用来描述更加完整和复杂的系统状态。

  • Sample(样本)

    样本是时间序列中某个时间点的单个值。在 Insight 中,每个样本由一个 float64 值和一个毫秒精度的时间戳组成。

  • Service Discovery(服务发现)

    一个用于 Kubernetes 环境的服务发现配置,用于批量且自动地接入 Kubernetes 上的监控点。

  • Target(监控目标)

    被监控的对象;系统会定时向监控点发起抓取任务,从中获取指标。

评论