陽光保險(xiǎn)集團(tuán)數(shù)據(jù)挖掘平臺(tái)項(xiàng)目
陽光保險(xiǎn)集團(tuán)數(shù)據(jù)挖掘平臺(tái)項(xiàng)目
項(xiàng)目背景
在保險(xiǎn)行業(yè)中,隨著數(shù)據(jù)的日積月累,業(yè)務(wù)數(shù)據(jù)量已經(jīng)超過了億條的規(guī)模,這些寶貴的數(shù)據(jù)如果應(yīng)用于分析決策,將會(huì)帶來顯著的附加值。在大數(shù)據(jù)形勢(shì)下,作為國(guó)有七大保險(xiǎn)集團(tuán)之一的陽光保險(xiǎn)集團(tuán),正積極利用新理念和新技術(shù)挖掘數(shù)據(jù)的價(jià)值,實(shí)現(xiàn)正確及時(shí)的分析決策,不斷提升其競(jìng)爭(zhēng)力。陽光保險(xiǎn)集團(tuán)原有的分析系統(tǒng)中使用傳統(tǒng)數(shù)據(jù)庫,其性能已無法滿足海量數(shù)據(jù)查詢分析和挖掘的需求,亟需引入新的技術(shù)架構(gòu)支撐集團(tuán)對(duì)海量保險(xiǎn)業(yè)務(wù)數(shù)據(jù)的復(fù)雜分析和深度挖掘。
解決方案
為了滿足陽光保險(xiǎn)集團(tuán)對(duì)海量數(shù)據(jù)的查詢分析和數(shù)據(jù)挖掘需求,采用GBase 8a MPP Cluster大規(guī)模分布式并行數(shù)據(jù)庫集群系統(tǒng)構(gòu)建數(shù)據(jù)平臺(tái)。數(shù)據(jù)庫負(fù)責(zé)海量數(shù)據(jù)的加載,基礎(chǔ)數(shù)據(jù)的整合和共性加工,構(gòu)建各主題的數(shù)據(jù)挖掘集市,完美支撐集團(tuán)的分析應(yīng)用和決策需求。
產(chǎn)品架構(gòu)圖如下
項(xiàng)目采用批量生成ETL 腳本工具,融合客戶多種業(yè)務(wù)應(yīng)用系統(tǒng)平臺(tái)信息數(shù)據(jù),大大提高了開發(fā)效率,保證數(shù)據(jù)的處理效率,為客戶深層次業(yè)務(wù)分析提供了強(qiáng)有力的支撐,滿足了用戶保險(xiǎn)業(yè)務(wù)系統(tǒng)信息整合及高速統(tǒng)計(jì)。
數(shù)據(jù)挖掘平臺(tái)滿足了集團(tuán)多個(gè)高層次的應(yīng)用:
通過歷史保單信息、客戶信息、交易信息、財(cái)務(wù)信息等數(shù)據(jù)分析,提升新業(yè)務(wù)的拓展效率;
通過險(xiǎn)種、交費(fèi)年期、被保人職業(yè)、被保人年收入、被保人年齡段等信息,優(yōu)選投保種類;
通過大數(shù)據(jù)組合及挖掘,深層次地分析險(xiǎn)種受眾群體。
應(yīng)用效果
高速加載、海量存儲(chǔ):實(shí)現(xiàn)加載億行大表數(shù)據(jù),同時(shí)提供高壓縮比入庫從而提升性能,海量存儲(chǔ)能力,整合多業(yè)務(wù)部門數(shù)據(jù),并可根據(jù)需求在線動(dòng)態(tài)擴(kuò)展;
即席查詢、秒級(jí)響應(yīng):在海量數(shù)據(jù)下,實(shí)現(xiàn)高速即席查詢、區(qū)間范圍查詢,為分析系統(tǒng)提供穩(wěn)定支撐;
高效分析、精細(xì)運(yùn)營(yíng):大幅提升保險(xiǎn)行業(yè)中涉及到的大表關(guān)聯(lián)、多表關(guān)聯(lián)查詢的運(yùn)算分析性能,復(fù)雜統(tǒng)計(jì)分析秒級(jí)響應(yīng),幫助客戶實(shí)現(xiàn)精準(zhǔn)營(yíng)銷、精細(xì)化運(yùn)營(yíng)。