联软科技应邀出席第七届税务信息化大会,联软科技营销中心副总裁魏继超参与此会并代表我司发表主题演讲-“税务敏感数据泄露风险管控平台”。
文章原出处:http://www.ctax.org.cn/news/rdzt/yxlwbj2013/bjsl/201401/t20140127_760035.html
此次会议圆满成功,与会的嘉宾、领导以及来自全国各地的税务代表和IT企业代表都融入在其乐融融的氛围内,大家互动交流,成果斐然!
以下为演讲具体内容:
大家上午好!
今天我为大家做的技术报告的主题是《税务敏感数据泄露风险管控平台》,简称防泄露平台。我们的目标就是保护税务的敏感数据。
有四个部分的内容:
第一部分是我们的平台介绍。
第二部分是我们的几个核心功能。
第三部分是平台价值。
第四部分对我们公司做个简单的介绍。
首先我们为什么要建设这个平台,主要有四点。
早在今年年初的时候,我们国家的主席习总跟美国的总统奥巴马会晤的时候就已经提到了网络及信息的安全。今年三中全会以后,成立了国家安全委员会,为了确保网络和信息安全。其中重点提到了税务。所以我们赶上了这么一个好时机。今年我们是花了很大的精力,在江苏地税定制开发了一套防泄露平台。
第二个要素,是在国税总局2012年的年底的时候,面向全国的税务系统发布了一个文件,就是税务工作秘密的管理暂行规定,这个文件主要从管理方面提出了一些要求。对我们来讲,我们明确了我们要保护什么,明确了我们的防护边界。所以我们把这种管理精神变成了技术手段,通过技术手段来落实这样的管理指导精神。其他的就是征管法,以及我们对税务业务数据的保护,保护税务业务系统归根结底是保护税务业务数据的安全,因此我们这个平台,我们保护的对象就是业务系统,而不是相应的文件。目标是很明确的。
我们都知道的一个问题,如果我们的设备丢失了,我们该怎么办,人员怎么去做培训,我们也知道。同时对于这种外设和通讯工具的管控都是非常成熟的技术,这些都是我们可以做到的,目前全国的国地税系统在这方面都可以做得非常好,但是我们提出几个问题,首先我们的系统中,哪些信息都存在什么地方,它们都是什么,哪些人需要访问,需要使用这些信息,他们的使用是否合规,是否规范。我们有没有足够快的手段来防护这些信息,同时配套以相应的审计手段,其实很难。
在这样的环境下,在这样一些问题下,我们就推出了防泄露的平台,我们的平台目标是什么?我们主要是以业务系统为我们的管控对象,这个就直接与世面上国内外的数据安全平台、防泄露平台拉开了距离,他们还在做文件、还在做网络数据的一种检测,我们把目标面向到我们的征管系统。
三类数据,静态数据、动态数据和使用中的数据,对它们进行发现、识别、分类、分级、监控和保护,形成一个完整的周期。我们的原则就是不对业务和数据库做任何的开发和改造,零改造。
我们建设的思路,五个步骤,是根据我们的建设目标来确定的。
第一,是我们的敏感数据的发现与迁移。这里我们提议提到敏感两个字,因为税务数据种类很多、文件也特别多,哪些数据是我们需要保护的,所以我们定义了一个敏感,这个敏感怎么来的呢?我们是根据国家税务总局的文件的精神,文件已经定义到了,分两类,一大类属于业务数据,另外一大类属于工作行政数据。
目前为止我们平台的管控平台已经形成了知识库的是我们的业务数据。对于业务数据,我们采用关键字的技术,然后对它进行发现和迁移。
第二,迁移之后怎么办,我们刚才说了信息在什么地方,它们都是什么,然后什么人需要去使用它。实际上很难做统计和科学管理,那么我们这个平台有一个创新的地方,就是我们对数据自动可以做分类、分级,同时对数据的分布和数据的流转,不管是对内的流转,还是第三方对外的流转,我们可以形成完整的审计,同时我们在配合数据可视化的技术,形成数据的管理视图,通过视图我们可以简单直观的了解到,我们整个系统的运行情况,我们数据的分布情况。简单来说我可以看到全省、哪一个市的敏感文件是最多的,具体有多少份,甚至我可以一步定位到某一台设备上它的文件是最多的,我们所说的都是敏感文件。
第三,就是根据我们现在第一步和第二步所做的基础工作,我们要定义有效的防护策略。通过有效的防护策略,我们要实施和执行这个防护策略,最终形成整个项目的精华所在就是我们的监控报告与审计,因为我们会最终输出一份风险报告。
那么平台的独到之处,我刚才说了由于国内外的数据安全平台我们有一个比较大的距离,就是根据税务系统的特点,我们不仅做到国外产品防被动泄密,我们更做到国内产品来防主动泄密,所以我们是双防。
第四,我们的对象从传统的文件保护演变为业务系统的保护。
第五,我们不仅仅是在做功能,我们更进一步去做了管理,什么样的行为是合规的,我们存在哪些风险,我们通过报告的手段一目了然。
那么第二部分就是我们的重点部分,是我们平台的核心功能。
核心功能,也是依据我前面的五个思路,就是我们的五个步骤,因为我们整个平台的开发也是依照五个步骤来进行的。
第一点,就是我们的敏感数据的发现与迁移。
这边有几个数据的一个共享。这个数据稍微有点老了,事实上我截止到来会场之前,我们在无锡地税1650台设备终端上,我们管控了22.5万份文件。平均一个设备上的文件被管控的数量大概是在159份。那么同时我们的发现效率,一分钟可以做到227兆,这里面因为要对所有的我们所定义的内容进行检索,最重要的是我们已经在大征管、大集中这个系统里面我们已经首先通过工作秘密管理暂行规定这个文件的要求,我们选了五个业务,作为我们的一期的管控的要点,就是个人所得税,房产、涉税举报、纳税人的隐私和个人秘密,以及第三方共享数据。我们形成了1300个关键字的支持度,同时我们的模板也有十几个。这里面1300个关键字,肯定不是由我们来进行筛选的。首先肯定是我们跟业务人员进行反复的沟通,最终定义下来这个宝贵的一个数据。
第二点,就是我们刚才已经提到了数据的可视化管理。那么在这里面这个图片是跳动的,其实可以从左边看到有我们的三分视图,分布、分类与分级。
分布,就是告诉你数据在什么地方。 分类,就是我们按照五个业务的类型来告诉你哪个业务的数据是最多的,然后它的使用情况是怎样样的。 分级的话,我们根据同样是数据,那么有些数据是比较敏感中是更敏感的。比如说是一些大数据。我们过程中发现比赛的数据,几百兆、上G的到处都是。这就是大数据,相应来讲就是高度敏感的数据。
同样我们对数据的流转,内部的流转和外部的流转。对外,就是我们对第三方共享。对内,因为我们有各分局、区级、以及科室之间的流转,所以这些流转我们都会进行统计,因为这里很有可能就有一些违规的行为。
通过前面的这样的一些基础,三分视图,加上我们的数据流转视图,我们就形成了我们的违规行为分析和风险的视图。这两类视图是建立在我们前面三分视图和流转视图的基础之上。
在这些所有视图的基础之上,我们最终形成平台最重要的也是最直观的展示的就是地图视图,通过地图视图,其实这也是我们日常运维中领导最关心的一些数据。因为通过地图视图,我们这个地图视图是可以下转的,也就是说我可以点到江阴市,就是江阴市的所有分局都会出来,我可以一目了然地看到我的总共的二十几个单位这些分局,哪个分局目前情况最严重,如果发生了严重的违规事件,直接就跟地震一样,我这边的红色图标就会跳动起来,也会发出实时地告警,所以这就是我们构建的一个预警平台,所以这个地图视图我们是花了相当大的精力,后台进行了大量的数据运算。通过地图视图,在右上角可以输出我们的风险报告,风险报告有一个专门的演示讲这个问题。