查看服务详细信息
单击服务,然后选择 查看详细信息。
使用服务详细信息页面,您可以查看:
-
托管服务的群集名称 (1)
-
服务的命名空间和服务标签 (2) (4)
-
与选定服务连接的所有相关的传入和传出服务 (3)
-
以图表格式提供服务关键指标,例如点击、响应时间、错误、数据量、SSL 前端错误和 TCP 前端错误。通过“具 有异常的衡量指标”选项卡,您可以查看特定持续时间内的异常情况 (5)。
有关更多信息,请参阅 使用黄金信号指标监视服务。
-
与服务关联的后端 Pod (6)。
使用这些关键指标趋势,您可以分析服务在特定时间持续时间内的执行情况。
例如,假设一个服务表示所有请求的服务响应时间大于 700 ms。作为管理员,您可以:
-
分析特定持续时间内的服务响应时间指标趋势
-
对问题进行故障排除
-
再次检查“服务响应时间”度量,以分析响应时间是否有所改善
指标详情
指标 | 说明 |
---|---|
访问量 | 服务收到的请求总数 |
错误 | 来自服务的 HTTP 错误总数 |
服务响应时间 | 从服务响应时间到第一个字节 (TTFB) 所用的平均响应时间。 |
Data Volume(数据量) | 服务处理的总数据量 |
SSL 前端错误 | 来自该服务的 SSL 前端错误总数。例如:SSL CLIENTAUTH FAILURE |
SSL 后端错误 | 来自该服务的 SSL 后端错误总数。例如:SSL 客户端错误 |
TCP 后端错误 | 来自该服务的 TCP 后端错误总数。例如:TCP 服务器重置 |
TCP 前端错误 | 来自该服务的 TCP 前端错误总数。例如:TCP 客户端重置 |
查看后端 pod 详细信息
单击 Pod 选项卡以查看与服务关联的后端 Pod。
-
Pod 名称 — 表示 pod 名称
-
状态 — 表示 Pod 是在运行(启动)还是未运行(关闭)。
-
IP 地址 — 表示 pod 的 IP 地址
使用“立即轮询”选项获取 Pod 状态
立即轮询 选项从群集获取最新的 pod 状态。
使用黄金信号指标监视服务
Kubernetes 群集中运行的服务中的黄金信号指标是指一组指标,使您能够在特定持续时间内检测潜在的异常情况。当您在 Kubernetes 群集中有 100 个微服务时,确定出现频繁问题的服务可能会很困难。以下三个关键指标是 NetScaler 控制台图表可以帮助您识别 Kubernetes 服务的潜在异常情况的黄金信号指标:
-
访问量
-
响应时间 (平均) 和响应时间 (P99)
-
错误
作为管理员,使用这些指标,您可以:
-
确定服务状态
-
关键 — 服务在多个指标中存在异常或阈值违反
-
评论 — 服务在任何一项指标中都存在异常或阈值违反
-
好 -服务没有异常或没有门槛违反
-
-
分析每个指标中识别了多少异常
-
排查问题并避免任何重大影响
识别异常
单击服务并选择 查看详细信息时,服务详细信息页面将显示所有指标的概述。单击“具有异常的量度”选项卡以查看异常详细信息。
对于每个指标,该图表使您能够在预期范围超过时查看检测到的异常。您可以单击选项以筛选图表中的视图。
考虑您想要分析服务响应时间 (P99) 的异常情况。
在 响应时间下,您可以查看所选时间持续时间的以下详细信息:
-
99 个百分位数 — 表示选定持续时间内 99% 的请求不到 60 毫秒
-
平均值 — 表示服务的平均响应时间
-
99.9% -表示来自服务的最长响应时间
-
异常 — 表示检测到的总异常
该图表还允许您查看所选时间持续时间的预期范围。根据这个例子,您可以查看:
-
预期响应时间范围在 1 毫秒到 9 毫秒之间。
-
由于服务响应时间超过了预期范围(1 毫秒至 9 毫秒),因此为服务检测到两个异常情况(一个为 60 毫秒,另一个为 25 毫秒)。