上海某區域大數據中心(以下簡稱:某大數據中心)自2020年成立以來,以數據全歸集、需求全滿足、目錄全梳理為目標,開展公共數據資源歸集工作,聚焦城市管理中的10家部門26個系統達10億多條的公共數據;同時以應用需求為牽引,圍繞城市應用場景進行數據治理工作,共治理數據近6億多條數據。前期已滿足了區域內15家單位的23個應用場景數據需求,提供數據16億多條的訪問,隨著業務訪問不斷增大,其數據量在日益劇增。
為迎合國家數據安全法律法規政策,深入貫徹落實習近平總書記對網絡安全和信息化工作提出的“網絡強國”“數字中國”戰略部署,緊緊圍繞落實推進法律法規要求,某大數據中心急需基于數據生命周期來設計全生命周期的安全防護,特別是解決數據流轉訪問的安全問題,提高數據安全保障能力,促進地區的民生經濟發展、社會管理、人民生活方面的影響力,為智慧城市數字化運營平臺提供可落地的解決方案。
☆ 用戶痛點分析 ☆
用戶宏觀層面
01缺乏整體的數據安全防護體系
02缺乏專項數據安全建設規劃
03缺乏數據資產梳理與責任劃分管理
04缺乏相應的數據安全規章制度
05其他客觀的問題和痛點
用戶微觀層面
01安全能力單元單兵作戰,針對風險事件無法進行統一的聯防聯動從數據產生到數據銷毀數據生命周期沒能夠做到全方位的管控;
02現有的日志審計系統只能針對系統的操作行為做審計,用戶數據庫自帶的日志審計系統雖然能夠審計sql語句,但相對專業的數據庫審計系統來說依賴性較強,易篡改、難管理,無法關聯到人、定責困難,對異常攻擊行為的檢測以及訪問控制手段欠缺、無法形成直觀可見的報表, 另外從安全管控的標準及法規角度來看,需要第三方獨立的審計設備。
03針對數據湖中的敏感數據的訪問權限控制欠缺,無法對運維人員或有權限人員的危險行為進行統一管控。
04數據風險事前預防,事中告警以及可視化未啟用。
05針對核心數據庫數據泄露后的確權建設不夠全面。
☆ 用戶需求分析 ☆
整體數據安全治理規劃
某大數據中心急需全面和整體對現有龐大數據資產的安全防護進行設計,形成專項數據安全治理規劃;
構建數據安全技術體系
加強數據安全組織管理建設,進行相應的數據安全規章制度建設,通過可落地的數據安全能力技術,形成數據安全管理的輔助手段;
? 落實和提高現有的數據安全防護能力
落實數據安全制度規程、實現數據安全防護的總體目標提供技術支持,保證紙面上的管理制度要求在實際工作中切實得到執行。
? 對敏感數據實現細顆粒度的管控
在敏感數據發現并分類分級的基礎上,遵循最小權限和動態授權原則,在數據全生命周期各個階段建立資產梳理、風險評估、數據訪問控制、數據水印、數據脫敏、數據操作審計等措施,實現數據可見、可控、可管,為業務的穩定、可靠運行保駕護航。
☆ 解決方案-構建數據安全防護體系 ☆
// 01.方案總體目標
某大數據中心其數據安全建設成果,達到讓決策者、行業用戶和社會公眾“看得見、看得清、看得懂”,因此需要實現大屏可視化,把區域內的靜態和動態數據能夠360度完美表現、采用易懂的表現形式和生動震撼的視覺傳達,讓人更容易記憶、理解和學習,從而實現大數據中心運行情況一套圖展示。
// 02.方案設計思路
昂楷從“一個中心、四重保障、六大過程”的頂層設計思路出發,為該大數據中心構建數據安全防護為中心,從組織、技術、運營和監管四個數據安全保障體系,實現大數據中心數據全生命周期六大過程的數據全生命周期的安全防護。
// 03.方案設計預期目標
構建大數據資源中心的數據安全,需要深度分析數據流向和業務數據訪問特性,結合業務需求統一定制策略來實現數據的安全訪問控制。
// 04.某大數據中心數據安全一期建設內容
構建數據資產梳理及分類分級管理系統、構建敏感數據脫敏系統,融合到大數據資源運營管理平臺中。
構建數據資產梳理及分類分級管理系統
? 解決數據資產梳理所存在的問題
1.敏感資產的比例、資產總數;
2.資產分類基本情況(包含哪些類型的數據庫資產);
3.資產中所包含的敏感類型;
4.當前資產的庫、表、字段統計信息;
? 數據庫資產管理基礎實現功能設計
1.主動掃描并自動發現數據庫資產;
2.數據庫資產掃描任務列表功能;
3.一鍵添加數據庫資產功能;
4.資產手動盤點、資產自動盤點;
5.資產手動確認功能;
6.支持資產各維度數據展示;
? 數據資產管理細顆粒度設計
1.敏感數據自動發現功能;
2.敏感數據自動發現任務列表;
3.敏感類型的自定義、編輯功能;
4.敏感字典列表、敏感字典管理;
5. 敏感數據資產展示;
? 數據分類分級功能設計
1.分類分級規則管理;
2.數據特征管理;
3.數據類型管理;
4.安全級別管理;
5.數據項分類分級規則;
6.數據集分級規則;
7.建立數據安全運營體系的流程;
構建敏感數據脫敏系統
1. 敏感數據脫敏設計
某大數據中心存儲著來自各委辦局的海量業務數據,其中包含了大量的敏感信息數據,在數據的使用過程 中存在以下泄露風險,需要通過數據脫敏平臺對敏感數據進行脫敏保護。
2.敏感數據脫敏實現機制
步驟一:敏感數據發現
大數據支撐平臺中敏感數據分布不清,需通過脫敏系統對庫中的敏感數據自動發現。敏感數據發現分為人工和自動兩種,一般是以自動為主結合人工輔助。人工可以指定數據脫敏規則、敏感數據特征和不同數據的脫敏策略。自動識別是根據人工指定的敏感數據特征,借助敏感數據信息庫和分詞系統自動識別敏感信息,相對于人工方式,自動識別可以減少工作量和防止疏漏。敏感數據發現是一個閉環過程,不斷優化和完善敏感數據信息庫。
步驟二:敏感數據梳理
在敏感數據發現的基礎上,梳理敏感數據列,敏感數據關聯關系,不同類型數據的不同脫敏方式,保證清晰的脫敏后關聯關系。敏感信息字段的名稱、敏感級別、字段類型、字段長度、賦值規范等內容在這一過程中明確,用于下面脫敏策略制定的依據。
步驟三:脫敏方案制定
針對不同業務的數據脫敏需求,在已有脫敏算法基礎上定制脫敏策略,主要通過脫敏策略復用不同脫敏算法實現。
步驟四:脫敏任務執行
安排脫敏任務,周期定時,并行處理,斷點續延,容錯。
3.項目關鍵技術:Web應用訪問數據脫敏設計
對插件進行認證管理,狀態監控,同步脫敏策略給數據脫敏插件,數據脫敏插件主動向數據脫敏策略管理系統拉取數據脫敏策略。
4.項目關鍵技術:數據脫敏插件功能設計
根據數據脫敏策略管理系統下發的策略對敏感數據脫敏,數據脫敏插件的使用方法,通過SDK的API調用。
5.動態脫敏系統部署
動態脫敏系統需要與終端用戶、大數據平臺數據源保持網絡連通,針對內部和第三方運維人員訪問生產庫的業務場景,部署如下:
針對應用訪問動態脫敏的業務場景,部署如下:
☆方案價值分析☆
通過本方案可以給用戶帶來諸多價值,主要體現在如下幾個方面;
第一、引導用戶建立并完善數據安全管理體系,引導組建數據安全管理團隊,完善安全制度及流程體系,提高數據安全管理能力;
第二、為用戶構建起統一的聯動聯防合成作戰的數據安全防護控制體系,可應對更加復雜的數據安全威脅及問題,提升數據安全防控能力;
第三、為用戶構建一套AI分析與自學習的智能化系統,能夠快速對數據安全問題進行學習建模,行為預判,提高數據安全防護工作效果;
第四、為用戶提供全方位的可視化數據安全態勢感知能能力,實現風險行為的快速識別與定位;
第五、無縫對接了用戶現有大數據資源平臺,其結構設計深度考慮靈活易擴模型,可以持續連接和豐富各種安全能力單元,最大程度發揮數據安全能力單元的安全價值。