5年节省专线费用4850W,再谈远程备份中前端重删的重要意义



数据重删备份是备份软件的高级特性。

为了达到真正备份数据的目的,客户的核心数据副本一般需要通过广域网备份到异地备份中心(远程备份),数据源端重删就可有效节约网络带宽、减低客户带宽租用成本,
另外通过目标端重删还可以节约备份介质存储空间,降低客户备份容量投资。
比如从杭州到深圳,如果租用1000Mb( 125MB字节/秒)的专线,需要费用1000W/年,如果用了前端重删产品,重删率如果是97%,那么久只要租用30Mb( 3.75MB字节/秒)
的专线,一般费用为30W/年;每年节省专线费用970W,5年节省费用 4850W 。

前重删 的关键优势在于:

· 首先在数据源端对备份数据进行重复数据删除,之后再通过网络传输

· 在现有网络和基础架构上实现快速的每日完整备份,每天一个全备份,保存 180天的备份数据;

· 将所需的日常网络带宽最高降至原来的 1/500

· 将备份速度最高提升 10 倍

· 由于采用全局重复数据消除技术,使得总备份存储最高减少至原来的 1/50

· 简单的一步恢复

备份方案的重删压缩类型非常丰富,一般分为源端重删、目标端重删 。

源端重删由备份软件提供,在服务器备份客户端完成重删,可以有效节约网络传输带宽,比如前端重删率99%,就意味着 10TB数据只要在网络上传输 100GB。

目标端重删也是由备份软件提供,在介质服务器上完成数据重删,可以有效节约存储空间,保存更长时间的数据副本。

数据重删首先以固定块/滑动块为单位进行计算Hash值,把计算出Hash值跟重删Hash索引库进行比对,如果Hash已经存在,那对应数据块就不再进行存储,只是用索引或指针来记录该数据块;
如果Hash不存在,说明该数据块是新数据,需要进行物理存储,再用索引记录,相同的数据块物理上只存储一次。通过索引指针,可以看到完整的数据逻辑视图,而实际上物理存储的数据却很少。

国内外优秀的备份软件,应该同时支持 源端重删(节省网络带宽)和目标端重删(节省存储空间); 优秀的前端重删对CPU的消耗不能超过10%,并且可以配置前端CPU性能消耗;
目前国内的 明和科技NETPRO DP产品支持源端重删和目标端重删 ,国外VERITAS NETBACKUP 等也支持源端重删和目标端重删。

数据恢复功能

数据恢复操作与常规恢复完全一样,通过Hash索引指针建立逻辑视图恢复,恢复过程不需要重组重复数据删除数据,也不需要使用重复数据删除数据库,所以恢复速度比较快。

NETPRO DP 是采用 逻辑全局重删指纹库架构(DDB),支持源端重删和目标端重删同时开启,备份任务开始时,如果客户端配置了源端重删,备份客户端将首先会把备份数据按照重删SHA 512 Hash算法,切成固定/滑动块大小计算Hash值。如果该Hash值在全局重删数据库(DDB)没有记录,说明该数据是新数据,则需要通过网络把Hash值传输给MA介质服务器,备份该数据块到备份介质,并更新全局DDB数据库记录。
逻辑全局重删指纹库架构可以支持按照节点进行横向扩展,也就是Scale-Out,并能实现所有节点间的全局重删。
这种支持Scale-Out的形式更符合 重删备份设备的要求。
这是因为,在备份场景下,后端的磁盘带宽通常不是瓶颈。主要的原因是经过重删,特别是加上压缩之后,需要下盘的数据量将急剧减少,并且一般以顺序读写为主,后端压力将会降低很多。