分散トレース

サービスグラフでは、分散トレースビューを使用して次のことができます。

  • サービス全体のパフォーマンスを分析
  • 選択したサービスとその相互依存サービス間の通信フローを視覚化
  • エラーを示しているサービスを特定し、エラーのあるサービスのトラブルシューティング
  • 選択したサービスとその各相互依存サービス間のトランザクションの詳細を表示

前提条件

サービスのトレース情報を表示するには、次のことを行う必要があります。

  • アプリケーションが東西トラフィックを送信する際に、次のトレースヘッダーを維持していることを確認します。

    ヘッダー

  • 1.7.23より前のCICビルドの場合、CPX YAMLファイルをNS_DISTRIBUTED_TRACINGと値yesで更新します。

    CPX YAML

  • 1.7.23より後のCICビルドの場合、ConfigMapを使用する必要があります。

    ConfigMapを使用すると、構成をPodから分離し、ワークロードをポータブルにすることができます。ConfigMapを使用すると、ワークロードの構成を簡単に変更および管理でき、構成データをPodの仕様にハードコードする必要がなくなります。

    ConfigMapのサポートにより、NetScaler Ingress Controller Podを実行したまま、構成を自動的に更新できます。更新後にPodを再起動する必要はありません。詳細については、Ingress ControllerのConfigMapサポートを参照してください。

    ConfigMapを使用すると、分散トレース、イベント、監査ログなどを有効または無効にできます。ConfigMapを使用するには:

    1. 必要なパラメーターを使用してYAMLファイルを作成します。

      次のYAMLファイルの例では、分散トレースが有効になっており、監査ログ、イベント、トランザクションなどの他の変数は無効になっています。

      apiVersion: v1
      kind: ConfigMap
      metadata:
        name: cic-configmap
        namespace: default
      data:
        LOGLEVEL: 'debug'
        NS_PROTOCOL: 'http'
        NS_PORT: '80'
        NS_HTTP2_SERVER_SIDE: 'ON'
        NS_ANALYTICS_CONFIG:
          distributed_tracing:
            enable: 'true'
            samplingrate: 100
          endpoint:
            server: <ADM-AgentIP> / <ADM-AppserverIP>
          timeseries:
            port: 5563
            metrics:
              enable: 'true'
              mode: 'avro'
            auditlogs:
              enable: 'false'
            events:
              enable: 'false'
          transactions:
            enable: 'false'
            port: 5557
      <!--NeedCopy-->
      

      Samplingrateの値は0から100の間で指定できます。NetScaler ADMは、指定された数のトレーストランザクションを表示します。

    2. 次のコマンドを使用してConfigMapを展開します。

      kubectl create -f <configmap-yaml>.yaml

    3. CPX YAMLファイルを編集し、envFromまたはargsのいずれかを使用して次の引数を指定します。

      envFrom:
       -  configMapRef:
           name: cic-configmap
      <!--NeedCopy-->
      

      または

      YAML

    4. いずれかの変数の値を変更する場合は、ConfigMapの値を編集します。この例では、他のすべての変数がfalseからtrueに変更されています。

      apiVersion: v1
      kind: ConfigMap
      metadata:
        name: cic-configmap
        namespace: default
      data:
        LOGLEVEL: 'debug'
        NS_PROTOCOL: 'http'
        NS_PORT: '80'
        NS_HTTP2_SERVER_SIDE: 'ON'
        NS_ANALYTICS_CONFIG:
          distributed_tracing:
            enable: 'true'
            samplingrate: 100
          endpoint:
            server: <ADM-AgentIP> / <ADM-AppserverIP>
          timeseries:
            port: 5563
            metrics:
              enable: 'true'
              mode: 'avro'
            auditlogs:
              enable: 'true'
            events:
              enable: 'true'
          transactions:
            enable: 'true'
            port: 5557
        <!--NeedCopy-->
      
    5. 次のコマンドを使用してConfigMapを再適用します。

      kubectl apply -f <yaml-file>.yaml

サービス追跡の詳細を表示

サービスグラフでサービスをクリックし、トレース情報を選択します。

トレース情報

選択したサービスのトレースサマリーページが表示されます。

トレースサマリー

トレースサマリーには以下が表示されます。

  • 提案と演算子を使用してトランザクションを検索できる高度な検索 (1)。詳細については、高度な検索を参照してください。
  • 1時間、12時間、1日、1週間、1か月、カスタム時間などの時間期間を選択できる時間期間リスト (2)。
  • 特定の時間期間の結果を表示するためにドラッグして選択できるタイムライン詳細グラフ (3)。
  • 各メトリックからオプションを選択できるフィルターパネル (4)。
  • 選択したサービスのトランザクション詳細 (5)。

トランザクション詳細の表示

トランザクションをクリックして、詳細情報をドリルダウンします。選択したサービスのトランザクション詳細を次のように表示できます。

  • 開始時刻
  • 終了時刻
  • SSLメトリック
  • 相互依存サービスとの通信 (各サービスのエラーと応答時間を含む)

次の例は、catalogue-store-serviceからのエラーを示しています。詳細については、トレース詳細の表示をクリックしてください。

トレース詳細

トレース詳細ページが表示されます。

トレーストランザクション

1 – トランザクションの開始時刻、応答時間、合計サービス、および合計スパンを表示します。

2 – 相互依存サービスと通信した選択されたサービスの詳細を表示します。各トランザクションをクリックして詳細を表示できます。

3 – 各サービスのトランザクション詳細を表示します。

例の画像によると、catalogue-store-serviceがエラーを示しました。catalogue-store-serviceで利用可能なトランザクションをクリックします。

トランザクションをクリック

product-catalogue-servicecatalogue-store-service間のトランザクション詳細では、HTTP応答が500であることが示されています。これらの詳細により、管理者はエラーのあるサービスを分析し、解決策としてproduct-catalogue-serviceのトラブルシューティングを行うことができます。

フィルターパネルの各メトリックからオプションを選択して、結果をフィルターすることもできます。たとえば、すべての5xxトランザクションを表示したい場合は、応答コードをクリックして500を選択します。

フィルターパネル

  • クライアントRTT: パケットがクライアントから移動する時間
  • サーバーRTT: パケットがサーバーから移動する時間
  • アプリ応答時間: アプリケーションの平均応答時間
  • データ転送時間: データ転送サイズと、サービスとの間で送信が発生する可能性のあるレート
  • 場所: クライアントの場所
  • ブラウザー: クライアントが使用するブラウザーの種類。例: Chrome、Firefox
  • クライアントOS: ブラウザーのユーザーエージェント詳細に基づくクライアントOS
  • デバイス: ブラウザーのユーザーエージェント詳細に基づくデバイス。例: タブレット、モバイル
  • リクエストタイプ: トランザクションリクエストタイプ。例: GET
  • 応答コード: サーバーから受信した応答コード。例: 501、404、200
  • 応答コンテンツタイプ: トランザクションコンテンツタイプ。クライアントのリクエストがtext/htmlの場合、サーバーからの応答はtext/htmlである必要があります
  • SSLプロトコル: クライアントが使用するSSLプロトコルバージョン。例: SSLv3
  • SSL暗号強度: 高、中、低などのSSL証明書キーサイズに基づく暗号強度
  • SSLキー強度: SSL暗号強度はSSL証明書キーサイズから計算されます。キー長はSSLアルゴリズムのセキュリティを定義します。例: 2048
  • SSLフロントエンド障害理由: フロントエンドSSLハンドシェイクエラーメッセージ。例: SSL CLIENTAUTH FAILURE
分散トレース