一、需求概述
A省新农合信息系统采取省市、县二级平台,以县为主,多级业务网络并存的模式。市级通过省级平台建立辖区虚拟信息管理平台。建设初期业务网络至少要覆盖到乡镇经办机构和乡镇级定点医疗机构,并随着业务的发展和门诊统筹的实施,新农合管理信息系统要扩展到村级定点医疗机构。同时新农合信息系统省级平台还是国家与县级新农合信息系统的枢纽部分;通过省、市财政部门接口,查询新农合各项数据。县级新农合信息系统平台又需和辖区内医疗机构进行互联;实现以县为单位的在线费用审核、即时结算和实时监控等功能。A省新农合信息系统平台将依托广域网链路实现省市级平台与国家级平台,省市级平台与县级平台,县级平台与辖区内医疗机构的数据信息交换。那么广域网性能快速和稳定将决定A省新农合信息系统的效率。所以A省新农合信息系统必须面临以下问题:
·有限的广域网带宽能否高效的实现安徽省新农合系统的运行,需要租用运营商的带宽,而且不断地在加大带宽,客户支付的成本也在不断加大;
·省市级平台与国家平台、县级平台的数据信息交换非常频繁,数据交换的高效决定安徽省新农合信息系统的实际价值;
·客户实际使用的带宽永远也达不到运营商所宣称的带宽;
·广域网带宽与局域网带宽之间存在巨大的瓶颈,因为局域网带宽已经达到百兆甚至千兆,而广域网带宽只有几兆、几十兆;
·如果客户的内部网络需要向互联网提供信息服务,这对客户的广域网带宽提出了更高的要求,如何在有限的带宽下,为互联网优化提供更好的服务也是重点关心的问题。
越来越多的外部人员在网上访问“一站式”服务,如何保障其访问的速度也是一大需求。
二、需求分析
1、TCP协议本身的问题
·绝大多数应用是基于TCP,而现在的各种TCP在广域网的传输效率低下。
·TCP是基于第四层的端对端的传输控制协议,TCP所采用的机制是一种简单的、固定的、无法对广域网自适应的流控机制。它无法自适应广域网带宽忽大忽小、延迟时长时短、丢包率忽高忽低的环境。
·目前最流行的20多种TCP机制都不会自适应广域网环境,都是固定的。
·TCP在广域网环境下会造成过多的数据包重传、延迟以及连接中断。
·TCP 协议是一个确保数据传输可靠的协议,在网络两端的主机建立TCP 连接的时候需要进行三次握手等连接确认机制,但是这些机制往往会因为网络延迟和丢包而显得效率较低。如不断的连接中断、不断的重新发起连接会话。
·TCP是面向连接的端到端传输控制协议,使用一种基于滑动窗口技术的流量控制机制。在TCP 协议传输数据的时候,一端到另一端所正在传输的数据量受传输窗口的大小限制,当该窗口满了以后,发送方就无法发送更多的数据,直到接受方确认已经接收了窗口中的部分数据。如果窗口太小的话,必然会影响数据传输和应答的速率,从而影响整个数据链路的吞吐能力。
·TCP差错控制方案采用肯定应答方式,即当某一帧的成功传输确认在给定的一个超时时间段中没有到达时,发送端就重传该帧。与上述机制有关的重要参数是重传定时器,它对TCP的吞吐量有很大的影响。另外,网络拥塞是造成TCP数据包丢失的主要原因,TCP中与网络拥塞有关的机制只有滑动窗口流量控制和差错控制机制,因此,从这两种机制衍生出如下4种主要的拥塞控制技术,分别为:慢启动、拥塞避免、快速重传及快速恢复。
2、广域网的问题
·广域网的带宽比局域网低的多。
·数据在广域网上传输受延迟的影响较大。一般延迟大于40ms时,应用的性能急剧下降到广域网带宽的10%,甚至更低;延迟越大,性能降低的越大;即使是更高的广域网带宽也一样,在延迟大于等于40ms及TCP窗口较小的情况下,T3线路的数据传输能力并不比T1线路更具多少优势。
·数据在广域网上传输受丢包的影响较大。当丢包率为1%时,应用的性能急剧下降到广域网带宽的10%,甚至更低;丢包率越大,性能降低的越大。
三、传统的解决方法
传输速度慢,首先想到的肯定是增加带宽,但是增加带宽就一定有效吗?
广域网性能与局域网性能存在巨大的差异。对典型应用分别在局域网、广域网( 2Mbps链路, 100ms RTT)的性能测试表明:这些主要应用的广域网性能只有局域网性能的1%,甚至还不到1%。比如:Web应用在局域网性能为72Mbps,而在广域网的性能仅为0.9Mbps;Email应用在局域网性能为30Mbps,而在广域网的性能仅为0.5Mbps。
与局域网链路相比,广域网链路通常带宽更低而延迟更高。但在实际应用中这些限制是如何影响应用性能呢?瓶颈主要有三个,其中一个与带宽相关,一个与数据拥塞、丢包与重传有关,另外一个和延迟有关。
首先,带宽这个瓶颈显而易见,因为没有任何一个应用在发送数据时可以突破带宽容量的限制。广域网带宽是个显著问题,一条T1线路的带宽大约只是一条典型的局域网线路的1.5%,而和千兆网相比,T1线路带宽只相当于它的千分之一,而广域网的数据延迟(一个端到端的数据往返所需要的时间)通常却是局域网的100倍或更多。由于广域网和局域网相比其宽度(带宽)窄了100倍而长度(延迟)却长了100倍,所以广域网性能自然也就成了一个大问题。压缩技术有助于节省带宽,但对很多应用来说,压缩对于性能的提高没有任何帮助,高丢包率和高延迟的问题必须解决。
先看一下丢包对广域网的性能影响:
基于TCP/IP协议,网络一旦出现丢包,对数据传输将产生致命的影响,传输速度将程指数性质的下降。尤其是在跨ISP(比如电信与网通)、跨国网络传输数据的时候,传输丢包率往往超过30%以上,因此必须要解决丢包率过高的问题。另外,由于目前中国电信运营商之间的带宽瓶颈,导致跨运营商的流量拥塞严重,其间的数据传输缓慢,丢包率高。
我们知道,TCP 协议栈在进行重新传输时效率非常低下。如果一个数据包丢失,协议栈可能需要传输整个拥塞窗口。此外,它们还将在出现网络拥塞时呈指数回退(即减少拥塞窗口并增加重新传输定时器),这种行为在数据包丢失时受到 TCP 的监测。尽管在通常情况下,数据包丢失在帧中继网络中无关紧要(平均低于 0.01%),但在 IP VPN 网络中则至关重要,这种网络数据包丢失率通常超过5%。在后一种情况下,高数据包丢失率会对性能产生灾难性的影响。而且数据包丢失和延迟影响相结合时,广域网性能急转直下,后果更加严重 。
再看一下延迟对广域网性能的影响:
第一类延迟瓶颈是由TCP协议的端到端应答机制所造成的。在TCP协议中,从一端到一端(比如在服务器和客户机之间)所正在传输的数据量受数据包窗口大小的限制。当该窗口满了以后,发送方就无法发送更多的数据,直到接收方确认已经接收了窗口中的部分数据。如果数据包窗口太小的话,势必会限制数据从一方传送到另一方并进行应答的速率,进而影响到整条链路的数据吞吐能力。从理论上说,这个瓶颈出现的几率很小,因为已经有很好的机制能允许TCP协议使用足够大的数据报窗口,而且现在流行的操作系统也都实现了这些机制。然而,客户机和服务器上的TCP协议缺省设置通常更适用于局域网而不是广域网,服务器和客户机上的TCP协议栈通常不能解决广域网的数据延迟问题。
第二类延迟瓶颈是由TCP的慢启动和拥塞控制行为引起的。这类延迟瓶颈在于TCP并不是总能利用最大窗口进行传输,也就是说,如果数据传送在一段时间内比较正常的话,TCP窗口大小会逐渐变大,但一旦传输失败的话其窗口大小会立即缩小。如果网络同时具有高带宽和高延迟特性,这种行为就会导致带宽的浪费从而延长数据的传输时间。
第三类延迟是由TCP协议之上的应用协议引起的延迟,即应用延迟。如果一个应用在应用层就受到应用消息大小和数据回应及确认需要的限制时,不管带宽有多充裕,也不管是否已经避免了第一、第二类延迟瓶颈,应用延迟不可避免。特别是针对用于局域网的应用协议,比如Windows上通过CIFS协议进行文件共享,就会受到应用延迟瓶颈非常严重的影响。
所以说如果不解决丢包与延迟的问题,增加广域网带宽不会带来多大成效。
增加广域网带宽不是最有效的解决办法。那如何实现广域网优化服务呢?或是广域网优化服务需要哪些条件呢?
四、LotWan的技术和原理
·LotWan不能解决网络的丢包和延迟,但能提高高丢包和高延迟下,TCP 传输效率低的问题;
·LotWan透明部署在网络中,能知道客户端到服务器的四个参数:网络的丢包率、网络的延迟、双方的TCP协议、网络的有效带宽;
·减少真正的网络丢包;
·自动调整滑动窗口大小,使TCP的传输效率更高;
·自动调整与服务器通讯过程的TCP的参数,使传输效率更高;
·双边开启压缩的功能,对TCP应用进行压缩,两个LotWan自动压缩能压缩的数据,使传输效率更高;对UDP应用是不能压缩的;
·对流量进行整形,减少Burst,以免网络边界设备产生拥塞;
·对UDP协议的VoIP应用,保证其优先通过;
·对UDP的应用不能加速;
·对于标准的http(服务在80端口上)不能压缩;
对于已经压缩的应用不能压缩,如:SSH,、SSL、Telnet、SMB(文件共享)、windows remote desktop (terminal service);
五、优化目标
希望通过此次建设,基本为下一步整体网络优化建设打下基础。本次建设的主要目标包括:
·合理利用网络资源。避免因为网络带宽使用不当带来网络应用效率的低下以及带宽资源的浪费,保护政府投资。
·保护关键应用,发挥网络最大价值。保障对应用访问的必须带宽。当各种网络应用同时进行时,就要保障关键性应用(如OA、VoIP、Email等)的使用效能。
·不是对哪一种应用加速,而是加速所有TCP/IP应用,以及VPN应用;
·在不升级带宽的前提下在现有的广域网上提供比以前丰富得多的应用服务,即在既有的服务水平上提供新的应用程序;
·即节省带宽,又能够获得更快的应用程序响应时间;
·确保数据在传输过程中以及在任何中央数据存储设施中的完整性和安全性;
·降低或延缓购买高带宽服务的需要,并且以更少的费用增加基础设施灵活性;
·解决上行流量过大,压死下行的的难题。
责任编辑:小草