数据存储基础
数据存储备份技术和存储管理源于70年代的终端/主机计算模式,当时由于数据集中在主机上,因此,易管理的海量存储设备--磁带库是当时必备的设备。80年代以后,由于PC的发展,尤其是九十年代应用最广的客户机/服务器模式的普及,此时网络上文件服务器和数据库服务器往往是要害数据集中的地方,而客户机上也积累了一定量的数据,数据的分布造成数据存储管理的复杂化。
Internet正在使存储技术发生着革命性的变化。这种变化主要表现在三个方面:首先是存储容量的急剧膨胀。其次是数据就绪时间的延展。今天,Internet使网络数据必须保证每天24小时、每周7天、每年365天处于就绪状态。最后,数据存储的结构不同了。在Internet和全球化电子商务的时代,数据应该是面向全世界的,数据的存取只应该受到安全机制的管理,而不应该受到地域空间的约束。
数据存储的重要性
从国际上看,以美国为首的发达国家都非常重视数据存储备份技术,而且将其充分利用,服务器与磁带机的连接已经达到60%以上。而在国内,只有不到15%的服务器连有备份设备,这就意味着85%以上的服务器中的数据面临着随时有可能遭到全部破坏的危险。因此,有必要持续不断地宣传数据存储备份的重要性,直到人们把数据存储备份视为头等重要的大事,并不断引进最先进的数据存储备份设备来确保网络数据的绝对安全为止。
对于一个企业来说,网络数据的安全性是极为重要的,一旦重要的数据被破坏或丢失,就会对企业日常生产造成重大的影响,甚至是难以弥补的损失。根据3M公司的最新调查,对于市场营销部门来说,恢复数据至少需要19天,耗资17,000美元;对于财务部门来说,这一过程至少需要21天,耗资19,000美元;而对于工程部门来说,这一过程将延至42天,耗资达98,000美元。而且在恢复过程中,整个部门实际上是处在瘫痪状态。在今天,长达42天的瘫痪足以导致任何一家公司破产!而唯一可以将损失降至最小的行之有效的办法莫过于数据的存储备份。
分析网络系统环境中数据被破坏的原因,主要有以下几个方面:1)自然灾害,如水灾、火灾、雷击、地震等造成计算机系统的破坏,导致存储数据被破坏或完全丢失;2)系统管理员及维护人员的误操作;3)计算机设备故障,其中包括存储介质的老化、失效;4)病毒感染造成的数据破坏;5)Internet上“黑客”的侵入和来自内部网的蓄意破坏。
近几年来,国内网络系统的规划和设计不断推陈出新,在众多网络方案中,通常对数据的存储和备份管理的重要性重视不够,至少在方案中提及不多,甚至忽略。当网络建成运行后,缺乏可靠的数据保护措施,等到出现事故后才来弥补。总之,不论是规划设计还是运行维护阶段,都缺乏对整个系统数据存储管理和备份应采取的专业而系统的考虑,往往陷于盲目之中。
可以说,网络设计方案中如果没有相应的数据存储备份解决方案,就不算是完整的网络系统方案。计算机系统不是永远可靠的。双机热备份、磁盘阵列、磁盘镜像、数据库软件的自动复制等功能均不能称为完整的数据存储备份系统,它们解决的只是系统可用性的问题,而计算机网络系统的可靠性问题需要完整的数据存储管理系统来解决。因此,对原网络增加数据存储备份管理系统和在新建网络方案中列入数据存储备份管理系统就显得相当重要了。
认识存储备份
人们对数据存储备份一词并不陌生,然而对备份的真正内涵并不完全了解。在一般人脑海里,往往把备份和拷贝等同起来,把备份单纯看作是更换磁带、为磁带编号等一个完全程式化的、单调的操作过程。其实不然,因为除了拷贝外,还包括更重要的内容即管理。备份管理包括备份的可计划性,磁带机的自动化操作、历史记录的保存以及日志记录等。事实上,备份管理是一个全面的概念,它不仅包含制度的制定和磁带的管理,而且还能决定引进备份技术,如备份技术的选择、备份设备的选择、介质的选择乃至软件技术的挑选等。
有不少人往往也把双机热备份、磁盘阵列备份以及磁盘镜象备份等硬件备份的内容和数据存储备份相提并论。事实上,所有的硬件备份都不能代替数据存储备份,硬件备份只是拿一个系统、一个设备等作牺牲来换取另一台系统或设备在短暂时间内的安全。若发生人为的错误、自然灾害、电源故障、病毒侵袭等,引起的后果就不堪设想,如造成所有系统瘫痪,所有设备无法运行,由此引起的数据丢失也就无法恢复了。事实证明,只有数据存储备份才能为人们提供万无一失的数据安全保护。
综上所述,用户特别是网络用户理想的数据存储备份就是用一种容量大、具有先进自动管理功能、价格又相对便宜的设备对整个系统,特别是对整个网络系统的数据进行备份,才是人们所希望的数据存储备份。
目前市场上的存储产品主要有磁盘阵列、磁带机与磁带库、光盘库等,其中磁带设备以其技术成熟、价格低廉、产品线齐全、使用方便等优点占据了存储市场的重要地位。
磁盘阵列
磁盘阵列又叫RAID(Redundant Array of Inexpensive Disks——廉价磁盘冗余阵列),是指将多个类型、容量、接口,甚至品牌一致的专用硬磁盘或普通硬磁盘连成一个阵列,使其能以某种快速、准确和安全的方式来读写磁盘数据,从而达到提高数据读取速度和安全性的一种手段。因此,磁盘阵列读写方式的基本要求是,在尽可能提高磁盘数据读写速度的前提下,必须确保在一张或多张磁盘失效时,阵列能够有效地防止数据丢失。磁盘阵列的最大特点是数据存取速度特别快,其主要功能是可提高网络数据的可用性及存储容量,并将数据有选择性地分布在多个磁盘上,从而提高系统的数据吞吐率。另外,磁盘阵列还能够免除单块硬盘故障所带来的灾难后果,通过把多个较小容量的硬盘连在智能控制器上,可增加存储容量。磁盘阵列是一种高效、快速、易用的网络存储备份设备。
磁带库
广义的磁带库产品包括自动加载磁带机和磁带库。自动加载磁带机和磁带库实际上是将磁带和磁带机有机结合组成的。自动加载磁带机是一个位于单机中的磁带驱动器和自动磁带更换装置,它可以从装有多盘磁带的磁带匣中拾取磁带并放入驱动器中,或执行相反的过程。它可以备份100GB—200GB或者更多的数据。自动加载磁带机能够支持例行备份过程,自动为每日的备份工作装载新的磁带。一个拥有工作组服务器的小公司或分理处可以使用自动加载磁带机来自动完成备份工作。
磁带库是像自动加载磁带机一样的基于磁带的备份系统,它能够提供同样的基本自动备份和数据恢复功能,但同时具有更先进的技术特点。它的存储容量可达到数百PB(1PB=100万GB),可以实现连续备份、自动搜索磁带,也可以在驱动管理软件控制下实现智能恢复、实时监控和统计,整个数据存储备份过程完全摆脱了人工干涉。磁带库不仅数据存储量大得多,而且在备份效率和人工占用方面拥有无可比拟的优势。在网络系统中,磁带库通过SAN(Storage Area Network-存储局域网络)系统可形成网络存储系统,为企业存储提供有力保障,很容易完成远程数据访问、数据存储备份,或通过磁带镜像技术实现多磁带库备份,无疑是数据仓库、ERP等大型网络应用的良好存储设备。
另外,随着制造技术和生产工艺的不断改进,磁带机的性能还将得到很大的提高。包括:磁带将被做得越来越小;存储能力越来越大;磁带机的自动化程度也将越来越高……而且,随着自动化程度越来越高,磁带机的优势越来越明显,从而在未来的存储市场中将长期扮演主流的角色。
光盘塔、光盘库和光盘网络镜像服务器
目前最好的多媒体海量信息存储载体或重要文献资料备份媒体,非光盘莫属。因为光盘不仅存储容量巨大,而且成本低、制作简单、体积小,更重要的是其信息可以保存100年至300年。因此,光盘普遍用于重要文献资料、视听材料、教育软件、影视节目和游戏动画等媒体信息存储,供广大用户重复只读。然而,一张光盘的存储容量毕竟有限,对于海量信息存储的网络系统来讲是远远不够的。要想获得海量信息的网络存取,就必须将保存有大量不同信息的几十张甚至几百张光盘组合起来使用。
光盘塔由几台或十几台CD-ROM驱动器并联构成,可通过软件来控制某台光驱的读写操作。光盘塔可以同时支持几十个到几百个用户访问信息。
光盘库实际上是一种可存放几十张或几百张光盘并带有机械臂和一个光盘驱动器的光盘柜。光盘库也叫自动换盘机,它利用机械手从机柜中选出一张光盘送到驱动器进行读写。它的库容量极大,机柜中可放几十片甚至上百片光盘片,这种有巨大联机容量的设备非常适用于图书馆一类的信息检索中心,尤其是交互式光盘系统、数字化图书馆系统、实时资料档案中心系统、卡拉OK自动点播系统等。光盘库的特点是:安装简单、使用方便,并支持几乎所有的常见网络操作系统及各种常用通讯协议。由于光盘库普遍使用的是标准EIDE光驱(或标准5片式换片机),所以维护更换与管理非常容易,同时还降低了成本和价格。又因光盘库普遍内置有高性能处理器、高速缓存器、快速闪存、动态存取内存、网络控制器等智能部件,使得其信息处理能力更强。
光盘网络镜像服务器是继第一代的光盘库和第二代的光盘塔之后,最新开发出的一种可在网络上实现光盘信息共享的网络存储设备。光盘网络镜像服务器不仅具有大型光盘库的超大存储容量,而且还具有与硬盘相同的访问速度,其单位存储成本(分摊到每张光盘上的设备成本)大大低于光盘库和光盘塔,因此光盘网络镜像服务器已开始取代光盘库和光盘塔,逐渐成为光盘网络共享设备中的主流产品。
在网络海量存储备份系统中,磁盘阵列、磁带库、光盘库等存储设备因其信息存储特点的不同,应用环境也有较大区别。磁盘阵列主要用于网络系统中的海量数据的即时存取;磁带库更多的是用于网络系统中的海量数据的定期备份;光盘库则主要用于网络系统中的海量数据的访问。