数据平面验证论文阅读
Libra
重点
大型网络的定义
拥有数千台交换机和数百万个转发条目的大型数据中心网络
满足大型网络中验证的基准
在在几分钟内验证10,000个交换机网络中的所有转发表项和数百万条规则
扩展和冗余设计原则
扩展和冗余设计原则是指在应用程序中构建冗余,以避免出现单一故障点,尽量减少协调,最大程度地减少应用程序服务之间的协调以实现可伸缩性,设计应用程序,使其能够扩大,根据需要添加或删除新实例,通过分区解决限制,使用分区来解决数据库、网络和计算限制等1。这些原则可以帮助设计高性能、高可靠、可扩展的分布式系统2。希望这些信息对你有所帮助。
除了常见路由错误(循环、黑洞、可达)外的隐性网络错误
有些错误只有在进行良性更改时才会显示出来。例如,当一个路由前缀被删除时,它会突然暴露一个不那么具体的前缀的错误
如果删除了10.0.0.0/8的路由前缀,则10.1.1.1/16的地址将无法到达目标,因为它现在被视为10.0.0.0/8的一部分,而该路由前缀已被删除。
使用MapReduce的原因
数据集
ToR交换机和Spine交换机
ToR交换机(Top of Rack Switch)是指将网络接入交换机放在一个服务器机架的上面,每个服务器机架往往有一个或者两个接入交换机。
这种组网的好处是简化布线,从服务器机柜到列头柜只有很少的电缆。ToR交换机既可以是接入层交换机又可以是汇聚层交换机还可以是核心层交换机。
Spine交换机是一种数据中心网络架构中的交换机类型,它通常用于连接ToR交换机和核心交换机
错误示例
拓扑
四种拓扑情况
分析
环路:图(b)显示了S11转发表中的错误如何导致循环。服务器192.168.0/down掉,S11向上转发数据包,即S21和S22。S11的转发表现在是:192.168.0/24→S21, S22 192.168.1/24→S21, S22网络有两个环路:S21-S11-S21和S22-S11-S22,地址到192.168.0/24的报文永远不会到达目的地。
黑洞:图©显示了如果S22失去其中一个转发表项:192.168.0/24→S11会发生什么。在这种情况下,如果S12将发送到192.168.0/24的数据包分发到S21和S22,到达S22的数据包将被丢弃。
不正确的快照:图(d)显示了一个细微的问题,在验证转发表时可能导致错误的结果。假设S11-S22之间的链路中断。发生了两个事件(如虚线箭头所示图中):e1: S22删除192.168.0/24→S11, e2: S12停止向S22转发报文。由于路由更新的异步性质,这两个事件可以按顺序(e1,e2)或(e2,e1)发生。快照可以捕获一个事件,但不能捕获另一个事件,或者可以检测它们以相反的顺序发生。序列(e1,e2)创建一个临时黑洞,如图©所示,而所需的序列(e2,e1)则不会。为了避免发出不必要的警报(通过检测(e1,e2),即使它没有发生),或者完全漏掉一个错误(通过错误地假设(e2,e1)发生了),Libra必须检测到正确的网络状态。
不正确的对照对应收敛状态不统一。之后Flash解决了此问题
spine and leaf switches
Spine和Leaf交换机是数据中心网络拓扑结构的两个交换层,其中Leaf层由接入交换机组成,这些交换机会对来自服务器的流量进行汇聚并直接连接到Spine或网络核心。而Spine交换机则在全网格拓扑中互连所有Leaf交换机。¹³