top of page

從「磁碟備份」邁向「跨區域備援」:OCI 容災進階指南

  • 9小时前
  • 讀畢需時 3 分鐘

文章撰寫:Wayne Hung / 奧登資訊工程師


先前的文章中,我們探討了如何運用 OCI Block Volume 的備份與還原機制,來確保日常維運的資料安全。


然而,單靠「在地備份」甚至是「跨區域備份拷貝 (Cross-Region Backup Copy)」,真的足以應付區域級別的重大災難嗎?



這裡隱藏著一個許多企業在規劃雲端架構時常忽略的地雷:資料落差的時間差。這也是我們在談論廣域災難時,必須從單純的「資料備份」全面升級為「業務備援 (Cross-Region DR)」的最關鍵原因。



重新檢視您的容災底線:RTO 與 RPO


衡量任何災難復原計畫,都離不開兩大核心指標:


  1. RTO (Recovery Time Objective,復原時間目標):從服務中斷到副中心接管流量,企業能容忍多少時間的停機?

  2. RPO (Recovery Point Objective,復原點目標):災難發生時,企業允許遺失多少時間的資料?


如果您目前的策略是依賴 OCI 內建的自動備份策略 (Policy-based Backups) 將備份檔拋轉到另一個區域,您會面臨一個硬性限制:自動備份排程最短只能設定為每天一次。這意味著您的 RPO 高達 24 小時。一旦主中心在深夜癱瘓,您將永遠失去過去這大半天內產生的所有交易紀錄與用戶數據。


要將 RPO 從「天」級別壓縮到「分鐘」甚至「秒」級別,我們必須改變策略。



突破 RPO 瓶頸的 OCI 跨區域容災策略


為了滿足嚴苛的 RPO 與 RTO 需求,企業必須利用 OCI 進階的非同步/同步複製技術,取代傳統的定時備份。根據預算與業務重要性,您可以選擇以下三種經典的容災架構(例如:以東京為主中心,雪梨為備援副中心):


策略一:動態防禦(Pilot Light)—— 大幅縮短 RPO 的經濟首選

  • 架構概念:在備援副中心只維持最核心的資料流動,運算資源 (Compute Instances) 平常處於關機或僅保留映像檔。

  • 實務運用

    • 儲存層:全面改用 OCI Block Volume 的 Cross-Region Replication (跨區域複製) 功能。此功能不受一天一次的備份限制,它會在背景持續將磁碟區的變更延遲同步到副中心。根據官方實測,跨區域的 RPO 目標通常能控制在 30 分鐘以內

    • 資料庫層:捨棄備份還原,改用 Oracle Data Guard 或 Autonomous Data Guard 進行跨區域非同步複製,確保核心數據的 RPO 逼近於零。


策略二:熱備援(Warm Standby)—— 兼顧 RPO 與極速 RTO

  • 架構概念:副中心是一個「縮小版」的生產環境。除了資料庫與磁碟區透過上述技術持續複製(確保低 RPO)外,Load Balancer 與應用伺服器也全數處於開機待命狀態。

  • 實務運用

    • 利用 OCI DNS Traffic Management 進行健康檢查。一旦主中心全面中斷,DNS 將自動把使用者流量無縫導向副中心。

    • 此架構同時解決了資料遺失與復原時間的難題,RTO 可大幅縮短至分鐘等級。


策略三:雙活架構(Active-Active)—— 零中斷的極致追求

  • 架構概念:主副中心同時開啟,共同分擔全球使用者的流量。任何一方崩潰,另一方自動吞吐所有負載。

  • 實務運用

    • 需要應用程式層級的高度無狀態化設計,搭配地理位置路由 (Geolocation Steering) 讓使用者就近存取。此架構能實現 RPO 與 RTO 雙雙趨近於零,但跨區域的資料庫寫入延遲將是架構設計上的最大考驗。



跨區域維運的隱形地雷


建置了低 RPO/RTO 的跨區域備援,並不代表維護工作就此結束。實務上,副中心最常在災難發生時「無法如期運作」,通常是因為忽略了以下細節:


  1. 網路與資安規則未同步:主中心的 NSG 安全規則或 Route Tables 一旦有變更,務必同步更新至副中心。否則切換過去後,極易發生「機器順利重啟,卻無法與外部 API 溝通」的窘境。


  2. 善用 IaC 自動化:強烈建議使用 OCI CLI 指令來管理及維護兩地環境。透過指令佈署主副中心,能有效避免手動設定造成的環境差異。


  3. 確實執行 DR 演練:定期進行切換測試,驗證 RTO 與 RPO 是否真的如預期般達標。若在演練過程中發現底層資源調度異常,第一時間向 OCI Support 開立案件並要求積極跟進,是雲端維運團隊不可或缺的防護網。



結語


從「每天一次的 Volume Backup」躍升至「分鐘級 RPO 的 Cross-Region Replication」,這不僅是技術的替換,更是企業對業務連續性承諾的升級。掌握好這些進階的跨區域複製與流量管理技術,您也能為企業打造一條堅不可摧的雲端護城河。






留言


bottom of page