数据保护
数据保护概述
数据保护方案概述
基于发展业务和快速决策的需要,企业越来越依赖于信息系统,而越来越多的数据也成为企业的核心价值所在。在存储整合前,基于对数据重要性的认知,大部分企业会有或多或少的手工或半手工的数据保护,如备份到本机磁带、数据库内置的数据导出等。随着应用系统越来越多,这种分散的保护(如下图)面临的挑战也越来越多:
·如何满足数据增长带来的备份速度要求
·如何管理日益增多的备份介质
·如何提高数据恢复的服务级别
·如何保证备份数据是安全的、可恢复的
·如何管理日益增多的备份介质
·如何提高数据恢复的服务级别
·如何保证备份数据是安全的、可恢复的

一般来讲,对数据的保护基本可分两大类:数据复制和数据备份。数据复制主要是为了防止单个硬件或单点(如机房、大楼被毁)硬件故障、灭失造成的数据丢失;数据备份主要是为了防止软件或逻辑的故障,如人为误操作、病毒、黑客等造成的数据丢失。
备份和恢复概述
常见的备份从原理结构上可大致分四种:传统网络备份、重复数据删除备份、快照和持续数据保护(CDP)。
传统网络备份按照备份数据流的走向可细分为LAN备份,即数据通过局域网备份;LAN-Free备份,即数据直接通过SAN备份;Server-Less备份,即数据不通过应用服务器直接备份。而对于NAS设备,还可通过NAS后端通过NDMP直接备份。
传统网络备份中按照备份介质不同还可分为备份到磁带或磁带库(Disk to Tape)、备份到磁盘或虚拟磁带库(Disk to Disk)。
而重复数据删除(De-Duplication)在大量重复数据的文件备份和异地分支机构备份中尤其突出。
快照和CDP大致可分别理解为给数据存储状况拍照片和拍录像。
备份中需考虑的因素比较多,如数据源的类型和结构、备份数据流的结构走向、备份软件、备份介质、备份的形式、备份的策略等等,这些因素都会影响备份结果。所以企业应该按照备份的目标即备份恢复点目标(RPO)和恢复时间目标(RTO)来选择适合的备份系统。下述简单比较供参考:
|
备份方式
|
主要优点
|
缺点
|
典型使用范围
|
|
LAN
|
投资少;
实施相对简单;
起步低
|
备份时影响应用性能;
网络速度决定了备份速度不高
|
首次集中备份;
晚上不使用或很少使用IT系统;
数据量不大,如少于1TB的
|
|
LAN-Free
|
备份对应用影响少;
速度快
|
比较复杂;
投资较大
|
24小时持续负荷运行;
数据量较大,如几个到十几个TB
|
|
ServerLess
|
备份几乎对应用无影响;
速度快
|
很复杂,投资大;
成功案例不多
|
24小时运行;
对应用性能要求苛刻;
数据量比较大
|
|
NDMP
|
不影响应用性能
|
只适用于支持NDMP协议的NAS
|
NAS应用环境
|
|
SNAP
|
速度极快(秒级);
投资较少
|
占用主存约20%空间;
快照数据和数据源都在同一存储柜,保护不完整;
|
已经存储集中;
需要快速恢复到较短时间前的;
一般和其它备份方式配合使用
|
|
CDP
|
持续数据保护,零丢失;
不影响应用性能
|
昂贵;复杂;
存放备份容量高
|
核心应用,数据不允许丢失;
数据量中等或以下
|
|
De-Dup
|
删除了重复数据对备份网络性能和容量负担减轻;
几乎每次都可做全备,恢复快
|
更适合文件系统或小型数据库;
|
大量文件;
分支机构;
数据量中等或以下
|
|
介质比较
|
主要优点
|
缺点
|
典型使用范围
|
|
磁带库
|
大容量;
单位容量便宜
|
易损,维护复杂;难立即验证备份结果
|
初次集中备份;
性能要求不很高;
超大容量数据
|
|
磁盘阵列
|
备份和恢复速度快;
可验证备份结果;
易维护
|
同比磁带库单位容量贵;
不兼容磁带库模式,需要独立的软件许可
|
对备份和恢复要求高;
数据量中等或以下;
新上集中备份系统
|
|
虚拟
磁带库
|
除了磁盘阵列的优势,一般带重复数据删除;
完全兼容磁带库模式
|
同比磁带库单位容量贵;
国内服务支持较少
|
只需替换磁带库从而立即获得备份和恢复的性能提高,无须更改备份形式和软件
|
典型数据备份方案参考:
·高性价比的数据备份解决方案(LAN B2D)
·高性能的数据备份解决方案( SAN B2 D or VTL)
·超大容量的数据备份解决方案(ADA+Centera+VTL)
·分支机构的数据备份解决方案(Avamar)
·大量文件的数据备份解决方案(Avamar)
·桌面系统和数据的备份解决方案(Atempo LiveBackup)
数据复制概述
从复制的形式上分,数据复制可分成同步、异步两种。同步复制可确保两份数据完全一致,因而适合核心业务或对数据要求苛刻的应用;因同步的流程特性,对网络的性能要求很高,因而一般需要复制源和目标之间光纤直连,并且对距离有限制。同步复制在没有收到源及目标端的写完成确认前,不会返回给服务器确认信息,以确保两份数据完全一致,流程如下:
1.在源端收到由服务器发过来的写I/O操作
2.I/O同步写到源及目标端
3.目标端返回确认写操作给源端
4.返回I/O写完成给服务器

异步复制因无需等待复制目标端返回确认信息即可进行下一步操作,所以相对比较灵活,对网络要求也没有那么苛刻,对距离也没有原则上的限制。但正因为使用了这种模式,有可能会造成源和目标端的数据不一致,也即可能会有部分的数据丢失,具体的丢失多少视网络等情况而定。
从结构上分,数据复制可以分成三种:基于服务器、基于存储网络或基于磁盘阵列三种。
基于服务器的复制利用IP网络实现复制,因而较经济,技术门槛也较低,不受传输距离的限制,较合适于起步或远距离数据复制。也恰恰是基于IP网络,性能会受到限制;同时主机端需要安装软件,并需占用主机的部分性能;当服务器数量比较多时,维护、恢复的工作量也迅速上升,因而比较合适较少的几台服务器的环境中。典型的产品如EMC Replistor等。当然,也有些基于数据库复制的解决方案如针对Oracle的DSG等在特定环境也是非常优秀的解决方案。
基于存储网络的复制基于存储交换机,也就是在交换机端把数据分离并复制到目标中。这种方案不影响服务器性能、高速稳定,而不足的是大都运行在Brocade、Cisco等SAN交换机上,对交换机性能和扩展能力要求比较高,若当前SAN交换机不兼容活性能不够的,需要改造SAN网络;还有,这种解决方案的实际案例相对来说还不是很多。
基于磁盘阵列的复制是最常见形式之一。当今主流的磁盘阵列都有自己的复制软件,如EMC CLARiiON的MirrorView,DMX的SRDF等。基于磁盘阵列的复制是目前性能最好、最可靠、最常用的复制解决方案。基于磁盘阵列之间的复制已经完全不影响服务器的性能,尤其在服务器较多的环境中优势突出;同时因利用了稳定、高性能的SAN网络,复制的速度也非常迅速,比较适合做同步复制;支持iSCSI的磁盘阵列也可以利用IP网进行数据复制,受限于IP网络的性能和不确定性,一般采用异步复制的方式。基于磁盘阵列的方案虽然有众多优点,但也存在如技术门槛高、投资较大、一般在同品牌磁盘阵列间使用更稳定等局限性。当然,随着技术的发展,也已经有异构的方案可以选择,如EMC RecoverPoint等。
几种复制方案的简单对比如下:
|
复制比较
|
主要优点
|
缺点
|
典型使用范围
|
|
基于服务器
|
易建,利用IP网,投资少起步快;可适用于两地距离非常远的环境
|
需要安装客户端软件,影响服务器性能和稳定;性能受限,一般多用于异步复制,数据保护不彻底;恢复比较复杂、耗时,尤其在多服务器环境
|
起步阶段,尚未建设SAN;服务器数量少,两地距离较远;经费较少,对数据丢失量不是非常敏感
|
|
基于存储网络
|
和服务器、磁盘阵列无关,扩展性好;性能好
|
多点复制投资较大,对交换机要求高,成功案例少
|
少数几个地点、多种服务器、多种品牌的磁盘阵列,对数据服务停顿或数据丢失很敏感
|
|
基于磁盘阵列
|
高性能、稳定;对服务器无影响;适合做同步复制或两种方式结合的环境;服务器众多的环境下维护反而有优势
|
投资大,有一定技术门槛;一般在同品牌磁盘阵列间复制
|
已经有或规划建设SAN环境;对数据服务停顿或数据丢失很敏感,尤其是24小时运行的IT系统。
|
典型数据复制容灾方案参考:
·高性价比的数据复制解决方案(Replistor)
·高性能的数据复制解决方案( MirrorView)
·异构的数据复制解决方案(RecoverPoint)
高性能复制解决方案
高性能复制解决方案 基于磁盘阵列的复制 适用客户 有数据中心的高等院校;运行关键业务系统的中大型制造企业;有 HIS 、 PACS 系统的大型医院;省、市级政府机关;小规模金融企业
详细...
高性能的数据备份
高性能 的数据备份 适合客户 中型制造业、高校、大型医院、政府机构等。典型特点如下 : 存储已经整合,拥有 SAN 网络 有集中备份,但通过局域网 目前有多台服务器,如 10 台以上
详细...
高性价比基于磁盘的网络数据备份
高性价比基于磁盘 的网络数据备份 适合客户 小型制造业、一般院校、小型医院、地方政府机构等。典型特点如下 : 数据不备份或者手工备份到磁带 目前有多台服务器,如 5 台以上,
详细...
超大容量的数据备份
适合客户 大 型制造业、高校、大型医院、政府机构、媒体等。典型特点如下 : 存储已经整合,拥有 SAN 和完备的备份系统 数据量很大,一般在 10TB 以上,并且历史数据不能删除、丢失
详细...
网络带宽受限的分支机构数据备份
网络带宽受限的分支机构 数据备份 适合客户 大 中型制造业、零售企业、政府机构、媒体等。典型特点如下 : 数据分散,分支机构众多 分支机构之间连接网络的带宽较小 目前有多种
详细...
