2022年10月4日 星期二

需要備份還是備援? 該如何規劃災難復原計畫?

備份與備援雖然詞彙很像,卻是兩件獨立的事情,但時常被混為一談,在建立備份、備援、災難復原計畫時,如果沒有搞清楚其定義,就容易發生設計了一個不完善,甚至不合用的復原計畫。本文文字較多,請繼續閱讀。


備份

指的是"資料"面的備份,包含即時備份跟時間差備份都算,並且建議遵循 "備份 3-2-1 "原則,就是指至少擁有 3 份資料備份、將這些備份存放至 2 種不同的儲存媒體、至少異地儲存 1 份。


備援

指的是恢復系統運作的規劃,並不含備份資料這件事情,例如伺服器掛掉了,從倉庫中拿了一台備用的伺服器接上去,讓系統恢復,這就是備援的一種體現。


RTO(Recovery Time Objective,復原時間目標)

指的是系統從發生故障的時間起算,至系統能恢復正常使用的時間間隔。例如今天中午12點伺服器掛了,今天下午四點拿了倉庫備用的伺服器上線,此時的 RTO 時間就是四個小時。


RPO(Recovery Point Objective,復原點目標)

指的是系統從發生故障的時間起算,至系統使用最近的一次備份的資料重新上線的時間間隔。例如今天中午12點伺服器掛了,今天下午四點拿了倉庫備用的伺服器上線,但是取用最近的資料庫備份紀錄是昨天晚上12點的,此時的 RPO 時間就是十六個小時。


備份的方式:

備份的主要目的是複製一份額外的資料,以免使用中資料損毀且沒有另一份資料可以取回使用,以下幾種方式都可以是備份的方式:

1. RAID1 鏡像磁碟陣列:透過磁碟陣列對一顆硬碟進行 1:1 的映射,保護當一顆硬碟故障時,仍有另一顆硬碟提供系統運作。( 缺點:如果只是資料損毀,而不是硬碟故障,另一顆硬碟也會同時紀錄故障的資料數據。)

2. 同伺服器內資料備份:藉由備份工具將伺服器的資料定時儲存一份至同主機的另一個資料夾,可設定差異備份,保護當伺服器的資料損毀時,仍有一份資料可以取用。( 缺點:占用伺服器的儲存空間,且當發生硬碟故障時,備份資料也會一起損失掉。)

3. 外接 USB 移動硬碟備份:藉由備份工具將伺服器的資料定時儲存一份至同主機的外接 USB 移動硬碟,可設定差異備份,保護當伺服器的資料損毀或伺服器故障時,仍有一份資料可以取用。( 缺點:USB 可被拔除,且重要資料可能藉由竊取 USB 移動硬碟帶走。)

4. 虛擬伺服器 / 實體伺服器 備份資料檔案至 NAS 網路儲存設備:透過 NAS 備份工具將伺服器的資料定時儲存一份至 NAS 網路儲存設備,可設定差異備份、可設定重複資料刪除、可進行備份與復原權限管理,保護當伺服器的資料損毀或伺服器故障時,仍有一份資料可以取用。( 缺點:需採購額外的 NAS 做備份服務,僅備份資料而不包含系統本身,如果需要還原包含系統的情況,會需要更長的時間。)

5. 虛擬伺服器 / 實體伺服器 備份整機系統至 NAS 網路儲存設備:透過 NAS 備份工具將伺服器的整機系統儲存一份至 NAS 網路儲存設備,可設定差異備份、可設定重複資料刪除、可進行備份與復原權限管理,保護當伺服器的資料損毀或伺服器故障時,仍有一份資料可以取用,可以透過虛擬化還原整個伺服器系統。( 缺點:需採購額外的 NAS 做備份服務。)

6. 備份資料的異機或異地備份:透過 Site to Site VPN 或本地端另一台 NAS 將備份資料儲存至另一台 NAS 上,以免備份資料的 NAS 故障且伺服器也故障的情況下,資料無從復原。( 缺點:需要再一台 NAS 做備份的備份。)

7. 備份資料的離線備份:透過 USB 移動硬碟或磁帶設備將備份資料儲存至離線資料載體上,以免備份資料的 NAS 故障且伺服器也故障的情況下,資料無從復原。( 缺點:需要人為管理離線資料載體。


彙整以上方式,就會整理出下面的幾種類別:

第一階段:原始資料的第一次備份:

1. 本地本機備份

2. 本地離線備份 ( USB 移動硬碟、磁帶 )

3. 本地 NAS 備份

4. 本地雲端備份

第二階段:備份資料的備份

1. 本地 NAS 的本機備份

2. 本地 NAS 的異機或異地備份

3. 本地 NAS 離線備份 ( USB 移動硬碟、磁帶 )

4. 本地 NAS 雲端備份


所以搭配上面的敘述,可以設計一個備份場景:

越南伺服器透過 IP-SAN 對 Storage 進行存取資料的作業,Storage 的 LUN 進行五分鐘秒級快照,並且將虛擬機透過 Active Backup for Business 進行每小時整機備份至 NAS,NAS 每日透過 Hyper Backup 進行一次 USB 移動硬碟與 台灣端 NAS 的異地備份。

此時備份有四份:

1. Storage 上的快照

2. NAS 上的 Active Backup for Business 整機備份

3. NAS 旁的 USB 移動硬碟 Hyper Backup 備份 Active Backup for Business 的整機備份

4. 台灣 NAS 備份越南 NAS Hyper Backup 備份 Active Backup for Business 的整機備份



備援的規劃:

前面說完備份的方式,但是備份的目的是為了系統能夠恢復正常運作,這時候就要談到備援的規劃,在規劃前需要先了解企業對災難復原的容忍度:

1. 允許多久恢復系統運作? (RTO)

2. 允許損失多少時間的資料? (RPO)


RTO 時間決定了應該準備多少程度的備援設備與架構。

例如 HA ( High Availability ) 高可用性設計,縮短甚至消除因計畫性 ( 硬體維護 ) 或非計畫性 ( 硬體故障 ) 所造成的停機時間,此類設計規劃,需要幾乎整個系統的備援硬體,但是能夠為企業盡可能的消除停機時間所造成的企業損失。

另一種可能則是異地備援,以另一個地點的設備做為備援計劃的設計,因為通常高可用性 HA 架構設計作為同一機房內單點設備故障的備援措施,當發生重大天災人禍時 ( 如火災、地震、暴動、颱風等 ),可能會造成整個資訊機房都損毀的狀況,這時候就需要另一個地點的機房設備作為備援計畫,來確保企業營運不致於中斷。

中小企業可能不會選擇上面兩種備援方式,主因還是投入成本與運作成本的問題,這時候適當的災難復原計畫,也能夠幫助企業盡量減少停機時間,透過 RTO 評估自身的接受能力,選擇適當的備援方式,降低停機的時間成本的損失。


RPO 時間決定了頻寬與備份成本。

因為 RPO 評估企業最多會損失多少的數據量,如果要減少數據量的損失,勢必要增加備份的頻率,例如異地備份就需要大量的頻寬的使用,所以會盡量安排在非業務高峰時間進行,如果做同步的異地備份,那就不分時段都要足夠的網路頻寬傳輸資料,這就產生的網路成本的變化。

因為頻寬成本的考量,可以選擇不同距離不同頻率的備份方式,例如本機端五分鐘一次、異機每小時一次、異地每天一次,來為備份的頻率與成本找到一個能夠接受的平衡點。


結語:

透過"備援"的系統,運作"備份"的資料,兩者結合建立"災難復原計畫",為企業建構安全的營運保障,這裡要特別注意的是,災難發生的方式不只一種,其災難復原計畫也要為不同的災難場景規劃不同的計畫。

例如 2014 年的越南 513 暴動期間,有企業的廠房甚至辦公樓被放火燒毀,此時如果僅設計備份資料與原始資料都放在同一個機房,就有可能發生再也無法取回資料的狀況,所以在評估時期應多方面評估可能發生的狀況與如何恢復系統。



沒有留言:

張貼留言