查看服务详细信息

单击服务,然后选择 查看详细信息

服务详细信息选项

使用服务详细信息页面,您可以查看:

  • 托管服务的群集名称 (1)

  • 服务的命名空间和服务标签 (2) (4)

  • 与选定服务连接的所有相关的传入和传出服务 (3)

  • 以图表格式提供服务关键指标,例如点击、响应时间、错误、数据量、SSL 前端错误和 TCP 前端错误。通过“具 有异常的衡量指标”选项卡,您可以查看特定持续时间内的异常情况 (5)。

    有关更多信息,请参阅 使用黄金信号指标监视服务

  • 与服务关联的后端 Pod (6)。

    服务详细信息

使用这些关键指标趋势,您可以分析服务在特定时间持续时间内的执行情况。

例如,假设一个服务表示所有请求的服务响应时间大于 700 ms。作为管理员,您可以:

  • 分析特定持续时间内的服务响应时间指标趋势

  • 对问题进行故障排除

  • 再次检查“服务响应时间”度量,以分析响应时间是否有所改善

指标详情

指标 说明
访问量 服务收到的请求总数
错误 来自服务的 HTTP 错误总数
服务响应时间 从服务响应时间到第一个字节 (TTFB) 所用的平均响应时间。
Data Volume(数据量) 服务处理的总数据量
SSL 前端错误 来自该服务的 SSL 前端错误总数。例如:SSL CLIENTAUTH FAILURE
SSL 后端错误 来自该服务的 SSL 后端错误总数。例如:SSL 客户端错误
TCP 后端错误 来自该服务的 TCP 后端错误总数。例如:TCP 服务器重置
TCP 前端错误 来自该服务的 TCP 前端错误总数。例如:TCP 客户端重置

查看后端 pod 详细信息

单击 Pod 选项卡以查看与服务关联的后端 Pod。

后端 pod

  • Pod 名称 — 表示 pod 名称

  • 状态 — 表示 Pod 是在运行(启动)还是未运行(关闭)。

  • IP 地址 — 表示 pod 的 IP 地址

使用“立即轮询”选项获取 Pod 状态

立即轮询 选项从群集获取最新的 pod 状态。

立即投票

使用黄金信号指标监视服务

Kubernetes 群集中运行的服务中的黄金信号指标是指一组指标,使您能够在特定持续时间内检测潜在的异常情况。当您在 Kubernetes 群集中有 100 个微服务时,确定出现频繁问题的服务可能会很困难。以下三个关键指标是 NetScaler 控制台图表可以帮助您识别 Kubernetes 服务的潜在异常情况的黄金信号指标:

  • 访问量

  • 响应时间 (平均) 和响应时间 (P99)

  • 错误

作为管理员,使用这些指标,您可以:

  • 确定服务状态

    • 关键 — 服务在多个指标中存在异常或阈值违反

    • 评论 — 服务在任何一项指标中都存在异常或阈值违反

    • -服务没有异常或没有门槛违反

  • 分析每个指标中识别了多少异常

  • 排查问题并避免任何重大影响

识别异常

单击服务并选择 查看详细信息时,服务详细信息页面将显示所有指标的概述。单击“具有异常的量度”选项卡以查看异常详细信息。

指标异常

对于每个指标,该图表使您能够在预期范围超过时查看检测到的异常。您可以单击选项以筛选图表中的视图。

过滤图

考虑您想要分析服务响应时间 (P99) 的异常情况。

响应时间下,您可以查看所选时间持续时间的以下详细信息:

指标 P99

  • 99 个百分位数 — 表示选定持续时间内 99% 的请求不到 60 毫秒

  • 平均值 — 表示服务的平均响应时间

  • 99.9% -表示来自服务的最长响应时间

  • 异常 — 表示检测到的总异常

该图表还允许您查看所选时间持续时间的预期范围。根据这个例子,您可以查看:

  • 预期响应时间范围在 1 毫秒到 9 毫秒之间。

  • 由于服务响应时间超过了预期范围(1 毫秒至 9 毫秒),因此为服务检测到两个异常情况(一个为 60 毫秒,另一个为 25 毫秒)。

查看服务详细信息