现状
早在行业初期,基本上只有两种安全岗位,WEB安全工程师和网络安全工程师,回忆近年来企业的风险事件,大多是安全工程师围绕安全漏洞的应用,以及如何在漏洞攻击和防御之间进行技术游戏。一般来说,由于当时对安全的认识,很少有人真正关注敏感数据对企业的真正重要性。
现如今随着GDPR、个人信息安全保护规范等一系列实施对数据泄漏的负面影响越来越大。为了更好地保护(避免)保护(避免)公共(锅)部门的数据,数据安全岗位开始火爆。数据安全有什么用?
从运维角度看数据安全
从安全运营角度来看数据安全建设的必要性,在我们呆过企业中可能会存在这样的对话:
(1) part1
焦虑的安全工程师问”你你你xxxxURL有个sql注入,快看哪个应用程序使用这个库,表中有哪些敏感字段,有多少数据受到影响”。业务通常是天真的回复“这个表没有敏感数据,没关系。我们现在就给我发泄漏通知。不要抄给我们的领导。”。
(2) Part2
焦虑的安全工程师从暗网接到监控报警,某公司数亿订单数据泄露,灵魂折磨“有内鬼。这是哪个库的数据?这么多敏感字段仍然是明文。这个字段以前在哪里可以看到?SQL这么多数据被注入拖出md业务还敏感数据。”。
如果上述类似对话经常出现在企业安全工程师的日常生活中,那么数据安全建设一定还没有开始。
发现&盲区
数据安全的第一阶段永远离不开问题。数据在哪里,也就是我们常说的发现敏感数据的能力?只有知道敏感数据在哪里,才能将重要的能源投入到需要关注保护的数据资产中。从安全操作的角度思考。
(1) part1
秋高气爽的一天Oracle接到一个plsql安全工程师可以在数据库审计中直接看到这一点plsql导出哪个数据库是什么级别,什么表,什么字段,有多少数据量,直接量化风险级别。
这些更准确的信息可以通过自动发单(通过邮件、企业微信等)自动转发报警通知。SYSLOG\KAFKA将原始日志的形式转发给安全部门)通知业务报警到安全部门,即减少安全工程师复杂的调查过程和撕裂墙和业务的过程。
(2) Part2
如果有一天高气爽的一天吃火锅唱歌,突然发现暗网有疑似数据泄露,通过数据安全平台快速检索数据字段,快速定位哪些库存隐患,这些库对应哪些应用,快速响应。
结合安全工程师的分析,我们可以进一步确认影响的范围。原来毫无头绪的问题突然有了逐渐明确的解决方案,不再像以前那样有一群南拳北斗“武林高手”跳上擂台却发现找不到像样的武器,打不出贡献,一顿花球秀腿后匆匆下场落得观众一片嘲讽。
数据安全
在数据生命周期的六个阶段,随着公司基础设施的完善,安全团队根据自己的团队配置有选择地选择启动环节,以降低后续安全和业务沟通成本,普及数据安全的重要性。
从哪里下手
发现数据安全基础的能力可以协调DB部门或从业务侧开始,作为一名数据安全工程师,你应该首先考虑如何实现你的第一个小目标-“发现基础数据的能力在哪里?”,从DB切入部门可以更快地实现安全部门和db部门的协同工作闭环运营,主要因为db有您需要的数据资源,安全部有数据分类和分级使用的需求分析能力。结果可以实现数据安全运行的闭环。
主动发现数据
从上到下,从安全委员会到业务线和数据组建立完善的在线数据库系统流程,统一的分类分类标准,数据分类大致可以根据用户数据属性,如用户信息、企业信息、商户信息
按类别分类
动态识别和识别数据的方法有很多,如静态规则和机器学习。目标是不断提高敏感数据的识别率。最简单的方法是直接访问所有库表结构字段和集中日志存储中心,自动审计不同的应用程序和不同数据库表中的敏感数据。
线下通过数据安全团队对离线分析数据进行分类和分级,生成库表级画像,可以完善一套基础“数据资产”图谱可以通过图谱权限的管理和审计逐步进行。当然,数据资产的发现能力不仅仅是这个维度,需要多维度的共同作用。
安全团队实现了在线和离线敏感数据的实时采集和发现,因此下一步非常明确,重点关注数据的分类和分类L3,L4个人敏感信息、公司级敏感信息、敏感数据脱敏存储、权限审计、数据库加解密等。
更多的是场景
更多的是场景问题、数据可追溯性、场景数据可追溯性过程大致如下、数据样本收集、数据样本特征分析(定位泄漏时间、定位字段、定位数量)确认泄漏源、确认泄漏应用,我们需要从大量数据中提取特征,如哪批泄漏字段、哪些库表、哪些应用。依次定位呼叫时间、呼叫库表和呼叫应用程序。
安全工程师会故意在不同的数据泄漏场景中添加一些处理数据“染色数据”,增加“染色数据”优点是数据审计方便,数据可追溯性收集特点方便。
对二次存储分析中使用的离线数据进行加密,对各种数据进行脱敏(数据染色)。可以理解二次数据染色的一般原则,重生数据,但不影响原业务数据统计分析结果,如业务需求“我们需要分析每个地区最近24小时的订单”,
安全工程师需要提炼这一需求。提炼后业务的真正需求是“业务需要订单转换率,注重整体比例,统计一批数据的百分比,但不注意某一字段的准确性,”比如小明用的是联通手机号185123123123,我们在保持联通属性185不变的后续几位可以转换为“0”也就是说,18512300,住所地址保留城市街道具体建筑数量染色,一批数据性别比例染色,保持原男女比例不变,使这批数据提供给业务侧统计分析不会产生影响,同时可以确保用户数据的安全。 这些数据染色的区别在于不同的应用场景。
小结
数据安全工作踩了很多坑,总结总结,仅限于老三、安全规模、基础设施程度、老板关注(是否发生事故),如数据分散,没有统一的数据总线,最好不要做任何权限管理,优先考虑那些可以占用更少的资源和闭环操作,如自动分类分类标记、脱敏等,不断迭代数据安全能力,丰富企业常见的数据安全场景解决方案能力,然后咀嚼识别染色权限管理也是一个不错的选择。