Citrix SD-WAN

高可用性

本主题介绍 SD-WAN 设备(标准版)支持的高可用性(高可用性)部署和配置。

Citrix SD-WAN 设备可以在高可用性配置中作为主动/备用角色中的一对设备进行部署。有三种高可用性部署模式:

  • 并行在线高可用性

  • 故障到线的高可用性

  • 单臂高可用性

这些高可用性部署模式类似于虚拟路由器冗余协议 (VRRP),并使用专有的 SD-WAN 协议。SD-WAN 网络中的客户端节点(客户端)和主控制节点 (MCN) 都可以在高可用性配置中进行部署。主设备和辅助设备必须是相同的平台型号。

在高可用性配置中,站点上的一个 SD-WAN 设备被指定为活动设备。备用设备监控活动设备。配置在两个设备之间进行镜像。如果备用设备在定义的时间段内失去与活动设备的连接,则备用设备将采用活动设备的标识并接管流量负载。根据部署模式,此快速故障转移对通过网络的应用程序流量的影响最小。

高可用性部署模式

单臂模式:

在单臂模式下,高可用性设备对位于数据路径之外。应用程序流量将重定向到具有基于策略的路由 (PBR) 的设备对。当网络中的单个插入点不可行或应对线失效的挑战时,可实现单臂模式。备用设备可以添加到与活动设备和路由器相同的 VLAN 或子网。

在单臂模式下,建议 SD-WAN 设备不驻留在数据网络子网中。虚拟路径流量不必遍历 PBR 并避免路由循环。SD-WAN 设备和路由器必须通过以太网端口或在同一 VLAN 中直接连接。

  • IP SLA 监控回退

    只要 SD-WAN 设备之一处于活动状态,即使虚拟路径处于关闭状态,活动流量也会流动。SD-WAN 设备将流量重定向回路由器,作为内部网流量。但是,如果两个活动/备用 SD-WAN 设备都变为非活动状态,路由器会尝试将流量重定向到设备。如果下一台设备无法访问,则可以在路由器上配置 IP SLA 监视以禁用 PBR。它允许路由器回退以执行路由查找并适当转发数据包。

并行内联高可用性模式:

在并行内联高可用性模式下,SD-WAN 设备彼此并行部署,并与数据路径内联。只使用通过活动设备的一个路径。请注意,绕过接口组被配置为故障到块,以避免故障转移过程中的桥接环路。

可通过内联接口组或设备之间的直接连接来监视高可用性状态。外部跟踪可用于监视上游或下游网络基础设施的可达性。例如,如果需要,切换端口故障转换为直接更改高可用性状态。

如果主动和备用 SD-WAN 设备都被禁用或失败,则可以直接在交换机和路由器之间使用第三级路径。此路径的生成树成本必须高于 SD-WAN 路径,以便在正常条件下不使用。并行串联高可用性模式下的故障切换取决于配置的故障切换时间,默认故障切换时间为 1000 毫秒。但是,故障转移会对流量造成 3-5 秒的影响。在生成树重新收敛期间,回退到第三路径会影响流量。如果存在到其他 WAN 链接的路径外连接,则必须将两个设备连接到它们。

生成树简单

在更复杂的情况下,如果多个路由器可能正在使用 VRRP,建议使用非路由 VLAN,以确保在第 2 层可以访问 LAN 侧交换机和路由器。

生成树复杂

故障到线模式:

在故障到线模式下,SD-WAN 设备在相同的数据路径中内联。旁路接口组必须处于故障到线模式,备用设备处于直通或旁路状态。必须为高可用性接口组配置并使用单独端口上的两个设备之间的直接连接。

注意

  • 故障到线模式下的高可用性切换大约需要 10 到 12 秒钟,因为端口从故障到线模式恢复出现延迟。

  • 如果设备之间的高可用性连接失败,则两台设备都进入活动状态并导致服务中断。要减少服务中断,请分配多个高可用性连接,以便没有单点故障。

  • 在高可用性故障到线模式下,硬件设备对中必须使用单独的端口,以实现高可用性控制交换机制,从而帮助实现状态收敛。

由于 SD-WAN 设备从活动切换到待机时物理状态发生变化,故障转移可能导致部分连接丢失,具体取决于自动协商在以太网端口上所需的时间。

下图显示了故障到线部署的示例。

故障到线路部署

对于转发大量流量的数据中心或站点,建议使用 One-Arm 高可用性配置或并行内联高可用性配置,以最大限度地减少故障转移期间的干扰。

如果在故障转移期间可以接受最小的服务损失,则故障到线高可用性模式是更好的解决方案。故障到线高可用性模式可防止设备故障,并行内联高可用性可防止所有故障。在所有情况下,高可用性对于在系统故障期间保持 SD-WAN 网络的连续性都很有价值。

有关基于 SD-WAN Orchestrator 服务的高可用性部署的更多信息,请参阅 设备详细信息

监视

要监视高可用性配置,请执行以下操作:

登录到已实现高可用性的活动和备用设备的 SD-WAN Web 管理界面。在 控制板 选项卡下查看高可用性状态。

监视高可用性仪表板

监视备用 MCN 高可用性仪表板

有关活动和备用高可用性设备的网络适配器详细信息,请导航到 配置 > 设备设置 > 网络适配器 > 以太 网选项卡。

主动高可用性 MCN 网络以太网

备用高可用性 MCN 网络以太网

故障排除

在高可用性 (HA) 模式下配置 SD-WAN 设备时,请执行以下故障排除步骤:

  1. 大脑分裂问题的主要原因是 HA 设备之间的通信问题。

    • 检查 SD-WAN 设备之间的连接是否存在问题(例如,两个 SD-WAN 设备上的端口都是启动还是关闭)。
    • 必须禁用其中一个 SD-WAN 设备上的 SD-WAN 服务,以确保只有一个 SD-WAN 设备处于活动状态。
  2. 您可以验证登录到 SDWAN_common.log 文件中的与 HA 相关的日志。

    注意 所有与 HA 相关的日志都使用关键词 racp进行记录。

  3. 您可以验证 SDWAN_common.log 文件中的端口相关事件(例如,启用 HA 的端口关闭或启用)。
  4. 对于每次 HA 状态更改,都会记录一个 SD-WAN 事件。因此,如果日志被滚动,您可以验证事件日志以获取事件详细信息。
高可用性