大数据时代数据传输需求呈爆炸式增长,如何充分利用数据流的新特征,发挥不同交换方式的优势,是解决未来大数据传输的必由之路。为此,介绍了大数据 传输在容量和能耗方面的挑战,并结合数据流的新特征,分析网络技术发展的新机遇。然后,回顾了近几年相关领域的研究进展,并简要介绍了笔者在混合交换和存 储转发等方面正在开展的研究工作。

关键词:大数据网络;电路/分组混合交换;存储转发;数据中心

1 引言

以互联网为代表的“信息高速公路” 计划发展20年来,人、机、物三元世界高度融合,颠覆了人类的生产生活方式,引发了数据规模的爆炸式增长。邬贺铨院士在《求是》杂志的载文中指出 [1],1998年全球网民平均每月使用流量是1 MB,2000年是10 MB,2003年是100 MB,2008年是1 GB(1 GB等于1 024 MB),2014年预计达到10 GB。全网流量累计达到1 EB(即1 024 PB)的时间在2001年是一年,在2004年是一个月,在2007年是一周,而在2013年仅需一天。我国网民数居世界之首,每天产生的数据量也位于世 界前列。总之,大数据存在于各行各业,一个大数据时代正在到来[1]。

据预测,未来10年全球数据将增加50倍,对数据进行处理分析的服务器数量将增加10倍。对海量数据进行存储、处理和传输,对网络基础设施提出了前 所未有的高要求[2]。据预测,未来几年内,数据中心之间的流量将以每年34%的速度增长,到2015年达到1 ZB。在网络基础设施的建设中,数据中心之间网络的成本占主导地位[3]。增加网络节点交换容量,提高网络资源利用效率成为大数据时代网络技术面临的最大 挑战。一个典型的例子,是作为世界上最大的基因研究所华大基因(BGI),目前仍然依赖传统邮寄的方式,而不是网络传输的方式来传递数据[4,5]。这是 因为目前的网络体制是从电信时代建立起来的,无法提供大数据时代的大容量高效传输,成为大数据应用快速发展的一个瓶颈。

在数据量爆炸式增长的同时,由数据交换和传输所造成的能源消耗也在不断增加。据统计,2006年仅在美国,数据中心中网络设备一年所消耗的电能为 30亿千瓦,并且这个数字在快速地攀升[6]。到2010年,数据中心所消耗的电能占全球总电能消耗的1.3%,在美国,这个数字为2%[7]。在电交换 方式下,如果接口速率从目前的10 Gbit/s 升级到40 Gbit/s,则网络节点接口和交换矩阵能耗将在目前的基础上翻番[8]。以电分组交换(IP)为基础的网络技术从能耗上来说缺乏大规模扩展的可能性,难 以满足大数据时代数据中心内部和数据中心之间的交换和传输的需要,而依靠光电路交换技术来提供大数据流的动态弹性大管道,与IP一起构成跨层的联合交换体 制,使大量的小数据流尽可能用IP处理,少量的大数据块尽可能用光交换处理,这样才有可能将数据流的传输能耗降下来。

2 大数据时代数据流的传输特征和网络发展机遇

研究表明,大数据时代网络数据流的分布出现了新的特征,少量的巨块数据消耗了大部分网络带宽,如同“寡头”侵占了大量资源。在一个典型的数据中心网 络中,以交互性强的信息为主的短流(数KB,称为老鼠流)数量上占90%以上,但流量上却不足10%。长流(100 MB~1 GB,称为大象流)在数量上只占10 %以下,但流量上却占90 %以上,并且其中大部分100 MB左右的数据流是由大文件切割而来的,实际的数据流达到GB级甚至TB级之巨,相当于大数据“寡头”,数据流的两极分化在快速拉大[9],如图1所示。 显然,利用现有的方式将占主体的大象流打包并进行逐跳(per-hop)处理,网络数据的传输效率必然十分低下,相应的能源消耗也非常高,与可持续发展策 略相违背。与此同时,大象流和老鼠流之间的资源竞争,也使得在网络瓶颈链路上老鼠流难以获得足够的带宽,各种丰富多样的交互式应用的体验难以得到保证 [10]。

299299029

图1 数量较少的巨块数据消耗了大部分网络带宽

另一方面,以基因研究、脑科学、高能物理、大科学计算和数据中心之间数据同步等为代表的海量数据传输需求,都有一个共同的特征,就是对数据整体的递 送时延要求较为宽松,如图2所示。此类数据通常不要求传输开始的时间,但要求全部数据流最后送达的时间,并且要求整个数据块的完整性[11~14]。这与 网页浏览、电子邮件、微博微信、电子商务、即时消息/音视频等应用要求数据被实时、即时递送形成了鲜明对比。例如,由欧洲大型粒子对撞机产生的27 TB的数据,需要以天为单位分发到分布于欧洲、亚洲和北美的相关研究机构中[5]。多个数据中心之间同步和备份的流量,绝大部分来自对时延不太敏感的背景 业务[9,11]。显然,将这些对递送时延不太敏感的海量数据按照传统的方式推送到目前的网络中,与对时延敏感的交互性应用争抢网络资源,一方面会极大地 影响交互式应用的体验,另一方面对大数据应用本身也帮助有限[10],还会降低网络的稳定性和可靠性[15]。

296296029

图2 巨块数据对递送时延不敏感

大数据流的以上新特征要求网络在能够处理传统短小数据流的同时,用更为简化的网络层次结构,综合利用网络中的交换、传输、存储资源,有序、批量、整 体地移动巨块数据。这样才可能提高网络资源利用效率,同时降低能耗。简而言之,深入分析大数据流巨块和时延不敏感的显著特征,为探索新型的传输机制提供了 机遇。

3 大数据传输的应对之道

如前所述,数据的爆炸式增长对网络基础设施的处理能力和能源消耗造成了很大的挑战。从大数据时代数据的特征入手,对症下药,有效地应对这两个挑战, 才能给大数据的发展提供持久、有力的支撑。下面从交换体制和网络控制等方面,阐述相关的研究现状和笔者在应对大数据挑战方面所做的工作。

3.1 混合交换体制和BLOC(blocking loss curve)框架

分组交换和电路交换是两种典型的数据平面交换方式。在分组交换机制下,网络节点对每个分组进行处理,通过统计复用实现较高的资源利用效率,同时也使 得节点处理较为复杂,能耗高,扩展性差。在电路交换机制下,网络节点通过信令机制或者管理系统建立或者删除交换状态,并以端到端的电路为单元进行处理。电 路交换节点结构较简单,但是由于粒度较粗,灵活性和资源利用率不及分组交换。显然,融合分组和电路交换有助于充分发挥两者的优势,降低节点的成本和能耗 [16,17]。

早在2003年,美国纽约州立大学乔春明教授[18]研究组首次提出了将光突发交换和光电路交换混合的方法,突发交换模块负责尽力而为的较小流量, 电路交换模块负责较大流量。2005年,韩国信息通信大学Lee等人[19]进一步从理论上计算了这种网络的性能。同年,澳大利亚墨尔本大学Tucker 教授研究组针对参考文献[19]中模型过于复杂的问题,进一步提出了一种更具可扩展性的计算模型[20]。2006年,日本东京大学Morikawa教授 实验室提出了一种混合电路与多波长光分组的混合光网络架构,设计并实现了一种光分组交换和光电路交换混合的交换节点结构原型。2008 年,比利时Ghent大学将流量分为快速与慢速两种类型,研究了快速与慢速混合的网络性能的通用模型[21]。2013年,Raimena Veisllari在一个集成的实验平台上演示了电路和分组融合交换,并实现了10 Gbit/s链路下超过99%的光路资源利用率[22]。

2010年至今,将混合交换应用于数据中心网络成为研究热点[23~25 ]。在这些研究中,光交换矩阵被应用于数据中心网络中,旁路网络中数据巨块的交换。研究表明,对于一个中等规模的数据中心,混合交换可以将网络的成本降低 至原来的一半,将网络能耗降低为原来的1/5。正如参考文献[26~28]中指出的,合理地融合电分组和光电路交换,是实现未来低成本、低能耗、大规模可 扩展网络的必经之路。几种有代表性的混合交换的工作见表1。

表1 有代表性的混合交换研究对比

297297029

从表1中可以看出,混合交换作为解决未来节点能耗和容量的方法,在各个场景下都有用武之地。理论上说,将更多的网络流量用电路交换递送,减少递送过 程中的复杂处理,有助于降低节点能耗和节点成本。但是也应该注意到,由于电路交换本身有一定的开销,即电路建立和删除需要一定的时间,电路交换并不适用于 交换持续时间较短的流。当链路容量固定时,如何合理地规划电路交换和分组交换的容量,实现最小化系统成本、最低能耗或者最低平均交换时延和阻塞率,是一个 非常复杂的问题。

在国家自然科学基金委重点项目“多层多域网络化大数据的高效传输理论与方法”项目中,为了解决混合交换网络中的最优化资源配置问题,提出BLOC框 架。BLOC框架将系统资源划分和系统的性能结合起来,可以直观且系统地研究混合交换系统中资源分配策略及相应的性能。图3为以系统能耗为优化目标的 BLOC示意。横坐标为通过分组交换递送的流量比例,纵坐标为分配给分组交换的资源(即链路资源)比例。图3中黑色曲线为系统所能容忍的最大分组丢失率等 值线,灰色曲线为最大阻塞率等值线。两条曲线所勾勒的阴影部分为带宽资源分配的可行区。可行区里的所有点为既能满足系统分组丢失率要求,又能满足阻塞率要 求的资源分配方法以及相应的系统性能。图3中两条曲线交点为最优化资源分配点,在该点系统尽最大可能把资源分配给电路交换,因此可以实现系统能耗的最小 化。

298298029

图 3 BLOC框架示意

BLOC框架有非常广泛的用途。例如,通过获得系统平均时延与流量分配和资源分配的关系,可以获得以最优化平均时延为目标时,系统的资源划分策略。

3.2 大数据的存储转发和时移多层图

目前,互联网对于数据处理的基本方式是,数据自应用产生后被分组化(packetize)并推送到网络,随后被网络以“尽力服务”的方式递送到目的 地。在整个过程中,数据分组会与来自其他数据源的分组共享和竞争网络资源。由于网络状况的差异和变化,同一数据源/宿之间完成相同数据量的递送可能需要不 同的时间,在网络发生拥塞时,这种差别会更为明显。在以交互式应用产生的老鼠流占网络数据主体的情况下,网络拥塞偶尔发生。在终端传输层协议的配合下,网 络可以迅速从拥塞状态中恢复,网络行为较为稳定可控,网络可以及时地将数据递送到目的地。但是,随着网络中大象流所占的比重增加,大象流和老鼠流之间的带 宽竞争变得日益激烈,严重的网络拥塞将频繁发生[15]。

这一问题引发了大量在网络中限制大象流的研究,典型方法是引入侵入式的流控系统(例如深度分组检测(DPI))[15,31]。同时,也促使研究人 员重新审视网络数据的特征,探索更为合理的数据递送机制来应对越来越多的大象流对网络造成的冲击。如前所述,不管是数据中心备份和同步导致的GB量级的数 据,还是大型科学计算产生的TB量级的数据,对递送期限的要求与传统交互式的应用相比有明显放宽。

在一个较早的工作中,David Breitgand 等人提出利用主动网络机制,将占用带宽较多、优先级较低的业务在网络中进行暂存(区别于缓存),减少它们和高优先级业务之间的资源竞争。结果表明,这种做 法可以有效地提高网络的有效递送效率(goodput)[32]。Nikolaos Laoutaris等人将这类数据称为时延不敏感的巨块数据(delay tolerant bulkdata),并针对这种时延不敏感性,提出利用网络闲时带宽进行数据传输。这种方法可以在不增加成本的前提下,在现有网络上完成每天TB数据量的 传输[11,12]。基于递送期限的研究工作还见于参考文献[33~35]。

这个问题在基于电路交换的光网络或者电网络中同样得到了关注。在参考文献[36]中,Hiroyuki Miyagi等人提出按照递送截止时间的不同,为请求分配不同数量的时隙,从而降低系统的阻塞率。Dragos Andrei等人将波长网络中带截止时间的请求(deadline drivenrequest, DDR)服务问题描述为一个混合整数线性规划问题,并提出了启发式的算法,高效地解决其中的选路和传输速率分配问题,结果表明具有电交换的不透明网络节点 具有更好的服务能力[37]。在参考文献[38]中,作者较为系统地研究了在新型的灵活栅格(flexi-grid)网络中DDR的优化调度服务问题,结 果显示动态调整请求的服务速率有助于提高网络性能和资源利用率。

简而言之,大数据块具有不同的截止时间要求,实质上是给网络资源分配和调度提供了一个新的空间,在节点中引入暂存,实质上是给网络资源分配和调度提 供了一个新的维度。在链路资源给定的情况下,充分利用数据块请求截止时间的差异,可以显著提高网络的平均资源利用率和网络的递送能力。

存储的引入给网络资源调度带来了新的维度,让这个本来就很复杂的问题变得更为困难。为此,在国家自然科学基金委重点项目“多层多域网络化大数据的高 效传输理论与方法”中,提出时移多层图(time shiftedmulti-layer graph,TS-MLG)的概念。时移多层图的基本思想是将网络资源的变化通过快照的方式记录下来,并通过连接不同快照(即不同层)之间对应的“时间” 链路(即temporal link,有别于传统网络拓扑中的空间链路(即spatial link)),构成一个网络资源增量变化的多层拓扑图结构,如图4所示。数据流在网络节点之间的传输和在节点上的存储,可以通过在多层图上运行传统的路由 协议解决。换句话说,时移多层图将一个时间和空间联合调度的问题,变成了一个简单的路由问题。

很显然,因为层数变多,计算的复杂度因此增加。研究结果表明,即便在较高的业务负载下,几乎所有的请求都可以在21层的图中找到合适的路径。此外, 在网络具有较轻负载时,绝大多数请求都可以在几层内即可完成路由选择。应用可以按照网络对阻塞率的要求和控制平面的计算能力,选取合适的层数来达到计算复 杂度和网络性能的折中。时移多层图提供了一个研究存储转发光网络的通用框架,将对大家认识此类网络的特性,优化网络带宽资源和存储资源的设计,带来非常重 要的影响。

3.3 软件定义和多层网络控制

近几年,数据传输需求和网络之间的矛盾集中地体现在数据中心网络中。随着数据中心在全球各地的建设和其规模的不断扩大,数据中心内部和多个数据中心 之间的数据传输交换需求越来越高,网络规模越来越大。日益突出的网络资源管理和服务质量的问题让人们开始重新思考网络中资源的分配和管理机制,软件定义网 络(software definednetworking,SDN)在这种背景下诞生了。SDN基本思想是,通过标准化的开放接口把网络节点的配置能力开放出来,并用集中式的 控制器对网络资源进行管理和控制。SDN打破了分布式自治的网络资源管理思想,为运营商、网络用户,甚至大数据量的应用更方便地管理和使用网络资源创造了 条件,降低网络管理复杂度,提高网络资源利用率,促进创新应用的发展[39]。

OpenFlow作为实现SDN的一种很有竞争力的技术,在近几年得到了工业界和学术界的广泛关注。OpenFlow将网络节点的数据平面抽象为流 表,并以流作为决策和控制的对象[40]。由前面的讨论可以看出,在大数据流的背景下,这种基于流的资源管理机制可以有效地提升节点资源的管理效率。 OpenFlow对流的定义较为灵活,可以将传统分组网络中的五元组作为定义流的依据,也可以将电路交换网络中的电路标识作为依据。因 此,OpenFlow事实上为分组交换网络和电路交换网络的融合创造了一定的条件[41,42]。在传送网领域,华为技术有限公司、Verizon公司等 提出软件定义光传送网(SDN-OTN),具备弹性管道、即时带宽、编程光网三大特性,可以满足未来不同业务快速部署、带宽按需分配、易于运维等要求 [43]。流交换的思想使得不同交换技术、不同网络层次的资源在流层得以抽象和统一。这使得OpenFlow/SDN成为多层[41]和多域网络[42] 控制平面很有竞争力的选择。

回顾前面几部分的讨论也可以发现,SDN 事实上继承了20世纪将集中式资源管理应用在大科学计算中的思想,是在大数据传输需求推动下的必然产物。OpenFlow/ SDN作为新型的控制平面技术,将有助于缓解大数据对网络管理带来的困难,成为多层和多域网络的控制平面的优选方案。

4 结束语

大数据传输既是挑战,更是网络技术发展的机遇。毋庸置疑,大数据时代的数据流特征将在未来几年内变得日益显著,也将成为推动网络技术创新的重要源动 力。单纯容量的提升难以满足业务量爆炸式增加的需求。如何充分利用数据流的新特征,发挥不同交换方式的优势,是解决未来大数据传输的必由之路。曾经风靡一 时的全分组化的思潮,极有可能在大数据的冲击下被淘汰。在这个过程中,节点设备的能耗和其制造成本一样,也将成为结构设计的重要限制因素。软件定义网络的 思想让网络管理变得更直观,也让网络重构和业务开展变得容易。但是,目前的设计思想距离真正的软件定义还有很大的距离。如何最大限度地消除应用需求和网络 资源提供之间的鸿沟,让软件或者应用理解网络且不失扩展性,还有很长的路要走。

作者,孙卫强、胡卫生,上海交通大学区域光纤通信网与先进光通信系统国家重点实验室