GBase新聞
GBASE遷移之異構OLTP數(shù)據(jù)庫遷移方案
當前,以Oracle、DB2等為代表的國際主流數(shù)據(jù)庫軟件產(chǎn)品,已經(jīng)長期、廣泛應用于國內(nèi)各行業(yè)的核心業(yè)務系統(tǒng)中。當用戶業(yè)務系統(tǒng)面臨替換改造時,需要解決異構數(shù)據(jù)庫在整個切換過程中數(shù)據(jù)遷移、應用兼容、新系統(tǒng)穩(wěn)定性等各種問題,以降低用戶進行數(shù)據(jù)庫管理系統(tǒng)架構遷移的風險。
日前,在工信部國家工業(yè)信息安全發(fā)展研究中心組織的數(shù)據(jù)庫產(chǎn)品應用遷移能力評測中,南大通用基于共享存儲的數(shù)據(jù)庫集群GBase 8s成功通過評測,在同/異構數(shù)據(jù)庫兼容、遷移評估、遷移實施、軟硬件兼容、遷移效率、性能優(yōu)化、數(shù)據(jù)校驗等維度表現(xiàn)優(yōu)異,全方位驗證了處理實際應用的遷移能力。
下面就異構OLTP數(shù)據(jù)庫遷移到GBase 8s的遷移方案做簡要介紹:
項目遷移流程
遷移流程是整個遷移工作的指導框架,可有效組織遷移工作的有序開展,主要流程步驟如下圖:
調(diào)研及方案設計
本階段主要進行遷移前的調(diào)研評估,以及用來指導形成遷移落地執(zhí)行的方案。內(nèi)容包括如下幾點:
1、遷移前期調(diào)研內(nèi)容及要點
調(diào)研的重點是了解客戶需求和當前的痛點,遷移后要有針對性地提供改善方案。遷移前期調(diào)研是遷移項目的重要工作環(huán)節(jié),此部分為項目實施不可省略環(huán)節(jié)。
1.1遷移前期調(diào)研的目標
了解項目遷移實施范圍
評估遷移工作量、實施工期、人員數(shù)量及能力要求
評估遷移技術難點、項目主要風險
1.2遷移前期調(diào)研的內(nèi)容
遷移系統(tǒng)現(xiàn)狀:原數(shù)據(jù)庫系統(tǒng)架構拓撲圖、相關配置、上下游情況、原庫版本
系統(tǒng)運行狀況:應用場景、重要性級別評估、應用部署架構、業(yè)務類型、業(yè)務場景中增刪改查各占的大致比例、并發(fā)情況、業(yè)務系統(tǒng)總用戶數(shù)
系統(tǒng)指標要求:業(yè)務高峰時期的響應時延要求,批處理并發(fā)數(shù),處理數(shù)據(jù)量、處理耗時、業(yè)務數(shù)據(jù)生命周期等
接口情況:應用開發(fā)語言,開發(fā)環(huán)境ORM框架版本信息、訪問數(shù)據(jù)庫接口協(xié)議、連接池配置、長連接/短連接等、第三方工具支持要求
2、遷移方案設計
遷移方案需根據(jù)遷移前期調(diào)研結(jié)果,并針對客戶對該系統(tǒng)使用需求和痛點制定項目替換改造實施方案,主要包括:
遷移系統(tǒng)的硬件配置和部署方案;
針對客戶需求和痛點提供的針對性解決方案;
遷移實施的步驟和工作內(nèi)容;
實施計劃和里程碑。
3、硬件資源評估
GBase 8s集群的硬件配置評估方式采用倒推的方法,即首先需要獲取原庫的詳細配置信息,之后再根據(jù)CPU整體核數(shù)、內(nèi)存容量、磁盤容量并結(jié)合業(yè)務數(shù)據(jù)量趨勢評估GBase 8s集群單臺服務器的配置以及配置服務器的臺數(shù)。原則上GBase 8s集群所有服務器的CPU整體核數(shù)、內(nèi)存容量和磁盤容量及盤片數(shù)量應不得小于原庫配置。對于倒推法不適應的場景,也可以參考GBase 8s集群推薦的硬件配置。
數(shù)據(jù)及業(yè)務遷移
GBase 8s提供平滑遷移整體解決方案,可使替換過程中GBase 8s數(shù)據(jù)庫應用上線過程風險總體可控、系統(tǒng)運行平滑。整個過程分為三個階段:在第一階段,需要在完成全量備份恢復的基礎上,通過數(shù)據(jù)同步工具實現(xiàn)當前主源數(shù)據(jù)庫向備用GBase 8s數(shù)據(jù)庫的實時數(shù)據(jù)同步;第一階段平穩(wěn)運行一段時間后,數(shù)據(jù)庫側(cè)進行主、備份角色互換后進入第二階段:由GBase 8s集群數(shù)據(jù)庫支撐業(yè)務系統(tǒng)運行,業(yè)務數(shù)據(jù)實時向源數(shù)據(jù)庫同步;最后階段,原數(shù)據(jù)庫系統(tǒng)割接下線,完成平滑遷移過程。
接下來需要通過對全量、增量數(shù)據(jù)的遷移、遷移前后數(shù)據(jù)的比對方式等技術難點進行提前規(guī)劃。
全量數(shù)據(jù)遷移方案評估及要點
遷移全量數(shù)據(jù),其遷移的時間窗口很大程度決定于全量遷移是一次性還是分批遷移。主要有以下幾個方面的因素影響,需要重點考慮:
源數(shù)據(jù)庫遷移數(shù)據(jù)量【需要實測以評估源庫內(nèi)數(shù)據(jù)的壓縮比】;
業(yè)務允許的停機時間窗口【此過程中源庫需要處于只讀狀態(tài),且負載要輕,往往是硬約束條件】;
源數(shù)據(jù)庫數(shù)據(jù)導出性能【需要實測已確定能力】;
遷移工具服務器臺數(shù)、IO性能、與8s集群網(wǎng)絡帶寬【遷移環(huán)境制約因素】;
8s集群節(jié)點的加載性能【IO性能和網(wǎng)絡帶寬綜合考慮】。
對于遷移時間窗口的預估,需按照如下的公式進行估算:
遷移整體時間 = 源庫導出時間 + GBase 8s加載時間 + 數(shù)據(jù)校驗時間
數(shù)據(jù)遷移需要還需要注意:
源庫數(shù)據(jù)導出的性能需要實測;
評估萬兆帶寬的使用率時要給出一定的冗余度,一般計算需要乘以1/2系數(shù);
整體時間窗口按照導出和加載串行方式評估,保證一定冗余度應對突發(fā)情況,而實際執(zhí)行時可以按照多并發(fā)方式設計遷移的實際執(zhí)行方式。
數(shù)據(jù)校驗
數(shù)據(jù)校對采用的方法是通過比對原系統(tǒng)和遷移系統(tǒng)對相同數(shù)據(jù)的加工結(jié)果,通過結(jié)果是否一致來推斷過程是否遷移的正確。
數(shù)據(jù)校對常用方法:
總量校對:count值、sum值、avg值對比;
分量校對:對表內(nèi)各維度進行group by后對這個維度的一個指標值進行count、sum、avg核對;
錯誤對比:在發(fā)現(xiàn)不一致的表時,將對比的表拉到一個環(huán)境上進行詳細分析,如進行minus運算,找出差數(shù)據(jù)再進一步分析;
校對報告:校對報告是校對工作輸出物,對數(shù)據(jù)一致性問題進行記錄和分析,對之前解決的問題進行追溯,形成數(shù)據(jù)校對工作常見問題的知識體系。