如何做到便宜的異地備份的方案

除了利用 FreeNAS 主機外, 還有另一種方式也可以做到相同的功能, 首先假設在外點需要除了要一份完整備份外, 期望能把每天的異動資料也能存放下來, 萬一有需要回覆的時候, 可以直接當場執行.

同時在總部這邊架設一台電腦, 利用 FastCopy 或相同的軟體去做自動同步的功能, 讓總部這邊隨時都有一份即時資料; 等資料收集完畢後, 總部自己也可以把資料備份到磁帶或備份硬碟上, 也能達到儲存異動資料的目的.

如何做到便宜的異地備份的方案
如何做到便宜的異地備份的方案

以上的作法就不適合跨過 Internet 執行, 除了同步時所產生的大量資料傳輸外, 通常同步軟體都是未經過加密處理的, 在公網上傳輸風險要自負喔.

簡易版異地備援方案

由於最近的不景氣, 在電腦投資上經費有所縮減, 原先提出的異地備援方案暫緩, 但又想要改變目前的備份方式, 只好另行規劃其他的方案, 先前分享的幾種同步的軟體其實就是為了找替代方案做測試, 想要找出最節省經費的情況下達到類似的功能, 同時也因為採取不同的方式, 原先資料損失的時間由最多2小時, 延長到 1 天, 未來在因需求分階段來建置.

此次規劃的目標:
1. 解決本地端的備份
2. 最多損失一天資料
3. 備份主機使用率提高
4. 資料最後集中至總公司收集後, 備份到磁帶備查

經過測試與評估後, 發現以下的方式比較符合公司目前的需求:
(a) 購買備份用主機, 虛擬主機軟體, 預計在上面可跑 Freenas, Windows Domain Controller (含DNS服務), Windows Update services, 測試用的 Windows server 等, 發揮一機多用的目的, 減少資源的重複投資.
(b) 購買磁帶櫃主機及磁帶, 放置於總公司內, 透過網路同步而來的分點資料統一備份.
(c) 採用免費的 VMWare ESX 版本, 作為備份主機的主要 OS, 上面在架設其他系統.
(d) 採用免費的 FreeNas 軟體, 達到遠地端同步傳輸有加密並透過壓縮減少頻寬的用量, 同時可利用 CIFS 功能作為檔案分享的立即備案使用.
(e) 採用免費的 FastCopy 作為 File Server 與 FreeNas 同步的機制.

Continue reading “簡易版異地備援方案”

備援方案結論

在測試了數個不同的備援機制之後,廠商的報價實在是很高, 在目前的景氣不確定的環境下只好先行暫停,等待景氣回暖後再來提案.

不過還是要把手邊整理出來的資料來做個總結,也方便下次如果要採購建置的話可以免除作比較的工作.

備援的目標包括有公司檔案分享( Windows Shares), Oracle DB 及MS-SQL, 所有的平台都是建置在Windows 環境上,測試的標準如下:

測試項目 說明 測試方式
檔案複製(1) 檔案複製到 TP Server 能正常的複製到 DR
Server
複製檔案到 TP -> TPE-O, 資料要能在 DR
開啟
檔案複製(2) 檔案複製到 DR Server 能正常的複製到 TP
Server
複製檔案到 TP -> DR-P, 資料要能由 TP
開啟
容錯測試(1) 檔案複製到 TP Server 時,
中斷 DR Server 連線,
網路重新連線上時能重新傳送資料
複製檔案到 TP -> TPE-O, 中斷網路連線,
重新同步完畢後, 資料要能在 DR
開啟
容錯測試(2) 檔案複製到 TP Server 時,
重新啟動 DR Server, 網路重新連線上時能重新傳送資料
複製檔案到 TP -> TPE-O, 重新啟動 DR,
重新同步完畢後, 資料要能在 DR
開啟
容錯測試(3) 大量複製檔案到 TP Server, 當 TP
還在跟 DR 同步時,
重新啟動 TP, 系統開啟後可以繼續傳送資料
複製檔案到 TP -> TPE-O, 重新啟動 TP,
重新同步完畢後, 資料要能在 DR
開啟
容錯測試(4) 大量複製檔案到 TP Server, 當 TP
還在跟 DR 同步時,
切斷電源並確認 DR 端檔案是否能被開啟
複製檔案到 TP -> TPE-O, 拔掉 TP
電源, 至 DR
電腦檢查同步中的檔案, 檔案必須要維持能正常開啟的狀態.
ACL權限設定 確認在做檔案同步連帶 AD 的 ACL
權限設定會跟著一起移轉
在兩台機器設定帳號及權限對應關係, 觀察到另一台伺服器是否有帶過去
Oracle
資料庫測試(1)
未啟動資料庫檔案可以正常的同步 Shutdown
DB, 中斷連線,
在另一端開啟
Oracle
資料庫測試(2)
開啟資料庫少量更新後, 並下 Commit
指令
中斷連線, 並在另一端利用同步的檔案重新啟動
Oracle
資料庫測試(3)
開啟資料庫後更新資料, 並於更新途中立即關閉主機 中斷連線, 並在另一端利用同步的檔案重新啟動
iSCSI功能 讓其他主機可以利用 ISCSI 功能分享本主機的空間 在主機分享出 iSCSI 資源,
可以在其他主機上安裝 Initiator 變成本機硬碟
Oracle
Over iSCSI

Oracle 可以安裝在網路磁碟機

iSCSI 分享出來的硬碟上面安裝 Oracle Datafile
SQL
備份備援
(1)
未啟動資料庫檔案可以正常的同步 Shutdown
DB, 中斷連線,
在另一端開啟
SQL
備份備援(2)
開啟資料庫少量更新後, 並下 Commit
指令
中斷連線, 並在另一端利用同步的檔案重新啟動
SQL
備份備援
(3)
開啟資料庫後更新資料, 並於更新途中立即關閉主機 中斷連線, 並在另一端利用同步的檔案重新啟動

(註)TP Server 代表主要機房的所在地點, DR Server 則代表 DR-Site

Continue reading “備援方案結論”

測試 NetApp FS2050 (II)

回到主選單來驗證一下
Test NetApp

就多了一筆 Aggregate 的紀錄, 因為剛剛開始建立, 所以看到的容量等資訊都是空白.
Test NetApp

等了一陣子後就會顯示出來剛剛新增加的Aggregate 變成已經準備好可以開始分割了
Test NetApp

接下來選擇 Volume -> Manage 先觀看一下已經存在的 Volumes, Volume 其實就是相對於 Windows 的分割區, 只是在 NetApp 上, Volumes 除了可以當成 Windows 的分享外, 還可以切割成切割 NFS 的分享以及iSCSI 的 Target 來分享給其他的Client端.
Test NetApp

目前存在的 Volume 列表, 還會顯示其使用的情況.
Test NetApp

測試 NetApp FS2050 (I)

這次測試異地備援的專案, 跟廠商商借了一台 NetApp FAS2050的機器, 裡面插滿了 20 顆 300G 的SAS硬碟, 全容量將會有 5.4TB左右, 透過 NetApp 特殊的機制 RAID-DP , 去掉兩台 Parity HDD 所得到的數字.

經過廠商設定與加入AD之後, 絕大部分的設定可以在網頁介面上控制, 如果覺得不夠, 也可以利用 Telnet 進入到系統內來做設定, 指令下的方式很類似 Unix 指令, 即時監控也可以利用這種方式來看.

首先進入網頁後, 輸入 ID/Password, 就可以看到以下的首頁, 幾乎所有的控制功能都在 FilerView 來設定, 底下更可以來看系統是否運作正常.
Test NetApp

進入後會另開一個視窗, 把系統的重要資訊列在右側的螢幕上, 左側的則是樹狀的架構選單
Test NetApp

Filer->Report 可以更詳細的列出目前系統的狀況,
Test NetApp

Filer -> Shutdown and Reboot 可以直接設定關機或者是重新開機, 當然已 NAS 來說, 常常執行這個畫面也覺得是怪怪的
Test NetApp

機器一開始運作要先製作一個 Aggregate (集合體?), Aggregate 主要的是要彙整 Disk / RAID group 變成一個大的資源 (Resource), 之後所有要分享出去的空間, 都是由 Aggregate 來切割出去. 以下是 NetApp 自己的解釋: Aggregates are containers that capture all the physical aspects of storage: disks, RAID groups, and plexes.

Aggregate -> Add 新增一個出來,
Test NetApp

選擇 Aggregate 名稱, 或是由系統自動帶入, 選擇 Double Parity 之後會啟動 RAID-DP功能, 同一個 Raid Group 可以有兩顆硬碟遺失, 跟 Raid 6 原理很像但是 Parity 的方式是用交叉計算得來 (技術人員告知的)
Test NetApp

選擇要使用幾個 HDD 進來, 但是由於會主動的扣除掉兩個做Parity 的硬碟, 所以是選擇越多硬碟越划算喔.
Test NetApp

硬碟可以由系統指定, 也可以人員指定, 不過硬碟的順序不等於機器上排放的順序, 所以自己指定看起來沒有太大意義.
Test NetApp

由於只有接 SAS 的硬碟, 所以沒得選擇別的型態.
Test NetApp

自己選擇要指定的硬碟, 其中有一個選項是 Allow Disks of Different RPM, 看了說明是可以 Override 強制性的解除這項功能, 讓高速的硬碟來配合較低轉速的工作效能.
Test NetApp

最後一個步驟系統會把所有的設定做成一個彙總的清單, 顯示在螢幕上讓你確認, 按下 Commit 後就建立這個 Aggregate.
Test NetApp