肥猫SEO论坛

找回密码
立即注册
发新帖
高端网站建设 可签合同 可上门沟通站群程序定制/蜘蛛池租用全行业SEO接单QQ1624516415全行业SEO接单QQ1624516415
2000+站点 外链一键通发原创SEO文章代写【点击】点击加入本站VIP 发帖免审核广告位招租

23万

积分

0

好友

7万

主题
发表于 2021-9-26 14:06 | 查看: 426| 回复: 0
BI体系里的数据赋能与营业决议计划:危害告警实例篇
编纂导语:在BI体系里,常常会碰到危害告警的场景,在这一类场景中必要加倍器重营业的办理和产物流程,实时解决问题;对付这类数小蝌蚪据决议计划类产物设计,咱们应当怎样做?本文作者分享了关于BI体系里的数据赋能与营业决议计划,咱们一块儿来领会一下。


01 甚么是危害告警?
危害告警是一个咱们在利用数据进程中会碰到的比力常见的场景。咱们今天具体说说这种场景若何举行数据决议计划产物设计。
1. 营业危害办理角度
从营业危害办理的角度上,一般将危害办理分为事先办理、事中办理、过后办理。
事先办理,目标是预防事变的产生;事中办理,目标是实时参与,防止事变变得更糟;过后办理,目标是缩小已产生的问题酿成的影响面、低落影响水平。
从营业危害的角度,咱们可以或许理解危害告警的目标。
2. 产物角度
从产物角度上看在平常营业场景中,一般可以分为流程类危害、总量类危害。
流程类危害,是流程监控中常见的,好比事变应当做而没有做、延迟做了、呈现了不该该呈现的事变(流程节点)。总量类危害,是程度监控、质量监控中常见的,好比今天应当完成几多,没有完成;日常平凡正常程度几多,如今监控指标跨越了正常程度至关比例。
从产物角度,咱们可以或许区别出咱们碰到需求的是哪一类问题。
02 危害告警解决方案
晓得了这两种分类,可以或许帮忙咱们在需求阐发阶段,很快的锁定住咱们的方针和大致的解决方案。
1. 一个例子
一家车联网公司,近来想做一个用户疲光驾驶的危害告警,营业方假想的场景是,若是跨越了交通律例划定的时候,就经由过程车联网APP给用户发出告警。

从危害办理的角度看,这个需求属因而过后办理,由于营业但愿是已产生疲光驾驶,发出提示。

从产物角度看,这个需求属于总量类危害(程度监控),当数据堆集到必定值,发出告警,这个必定值,是交通律例划定的,所所以一个固定值。

弄清晰这两点,咱们的解决方案也大要有了个轮廓,采纳计谋法子,经由过程监控延续驾驶时长这个数据指标,当数据指标达到阈值时,触发告警。那末,咱们产物方案的焦点就是要弄清晰延续驾驶时长这个数据指标的计较逻辑,这个和车联网收集上来的数据是甚么样高度相干,数据指标逻辑拔取是另外一个话题,咱们这里不开展了。

用这个例子向大师阐明,一个数据有关的危害告警场景的需求阐发大致是怎样做的。

概况上看,这个例子不太像BI体系干的活,更像是一个车联网的利用场景。究竟上,若是要在一个BI看板内里举行营业决议计划支撑的利用,他要面临的需求场景息争决方案城市更繁杂一些。

以前的文章里咱们提过,BI体系做数据决议计划之所所以一个比力难的问题,是由于实际世界存在繁杂性。

繁杂性决议了在做数据赋能和营业决议计划相干的数据产物设计时,要防止『一刀切』的设法,防止『一举而竟全功』,防止假想本身的设计可以或许『一次乐成』,这是一个不竭调优的进程(若是是一位计谋产物司理或算法产物司理,应当能很好理解),调解美意态,咱们起头吧。
2. 布景数据做危害告警的几种方案
用数据来做危害告警,大要有这么几种方案:
数据+计谋/法则数据+数据发掘/呆板进修数据+常识图谱
本文从产物角度,给大师先容需求场景若何与这些解决方案相连系。
03 危害告警实例
下面来看一个数据平安审计的例子。
1. 布景
如今,平台已有了敏感字段办理,对付用户的导出权限一般来讲不做限定,可是会去监控用户的导出操作与导出量举动,若是操作举动上看用户的导出跨越了正常营业必要,就属于疑似异样导出,平台要能辨认这类异样而且发出危害告警。

这是一个咱们凡是会碰到的需求描写。概况上看,需求很明白,但细心一揣摩,就会发明这个描写有不少模胡的处所。

这内里最大的必要明白的点,就是若何界说疑似异样导出的举动,即危害辨认。

那末按照分歧条理的需求,咱们的解决法子有响应的分歧:

夹克交友业侧说,咱们有很明白必要监控的重点表,按照以前的营业case,当产生这些举动的时辰(统一天内屡次导出分歧盘问前提的统一个表的数据;统一天内导出总数据量跨越xxx条数)就是疑似异样导出。只要先辨认出这些举动推送给咱们,经由过程一些日记去果断是不是真的是异样便可以。
2. 明白需求
起首果断,这是一个过后危害管控+总量类危害(程度监控)的需求,由于导出举动已产生了;其次,咱们果断数据决议计划的请求程度,营业方对告警的精度请求不高,他们已有了明白的经由过程现实案例堆集下来的法则,

数据要做的是甚么呢?帮忙营业方在举行危害辨认的时辰晋升效力、也就是挑选一个大面积的数据集,然后推送给营业职员进一步辨认。
3. 设计解决方案
1)肯定开端方案

需求到这个水平大致明白了,咱们可使用数据+计谋的产物解决方案。即统计每一个用户对监控的表的单日导出次数,和每一个用户对监控的表确当日单出总量,二者有一项超越阈值(或同时产生时),将用户信息及操作日记推送给指定的办理员用户。

2)迭代

如今,来看一下迭代需求。

对接人反馈,第一期上线后,确切解决了大海捞针的问题,可是如今公司范围扩展了,数据量和数据阐发职员增长,如今推送的疑似异样也多了不少,用户已阐发审核不外来了,能不克不及把危害比力高的给咱们,低危害的那些就先给这些用户做一些告警提醒。

营业对接人还提出来一些设法,好比依照导出次数巨细或依照数据量巨细去分这个危害凹凸,低危害可以等审核职员有空的时辰举行抽查。

起首经由过程果断,这是一个迭代需求,需求仍是过后危害管控+程度监控。

然后经由过程阐发,这些新增的内容,是对付告警数字新闻网的精度请求晋升了,说白了,就是要降燥。

营业方给的解决方案是:经由过程对辨认出的异样举行分级,分歧的级别对应分快猫视频歧的处置法子。怎样果断咱们能不克不及依照营业提出这个解决方案去做呢?

咱们从产物成长的角度阐发一下:

这个解决方案举行了危害分级处置,分歧级别危害,告警方法分歧。这个思绪必定没有问题。

3)分级的问题

在再进一步看,若何分级,用甚么原则去分级呢?咱们发明营业供给的这个分级的计谋比力刚性,若是用一个固定的数据指标值,可能会有两个问题:
导出数据量和次数与危害阈值的瓜葛,是和表自己存储的内容和数据量有关,或许分歧的表阈值是分歧的(象征着有庞大的保护法则的事情)。跟着营业范围成长,存储的数据量范围也会变革,即便统一个表,危害告警阈值很轻易就会必要变动。
那末这个法则从扩大性来讲,阈值不合适利用一个固定的值了,而是一个遭到一些影响身分会产生变革的数。

颠末一番需求阐发,发明营业对接人供给的解决方案思绪是ok的,可是细节还必要进一步去设计;那末此次产物迭代的方针是就是必要在数据监控的根本上,动态的去举行危害分级。

有些小火伴会说,这个时辰该算法工程师上啦!应当让算法同窗出解决方案了。

我要说,这个时辰实在产物的焦点逻辑还没思虑清晰,算法同窗接到需求,只会丢给你一个白眼好嘛!

4)梳理焦点逻辑

怎样去梳理这个焦点逻辑呢?

我的谜底是,要去思虑这件事变的本色是甚么,抽象出来。咱们要理解的事变是—危害告警推送给审核职员,他们到底在审核甚么?

带着这个问题和营业职员交换,沟通后发明,审核要找出用户是否是真的出于欠好的目标(好比窃取数据)导出数据。那末,咱们危害辨认,就是去可以或许辨认用户举动的歹意水平,而危害的分级,就是歹意水平的分级。

如今,需求转化成了一个相对于定量的,评估用户在平台举行数据导出或盘问等一系列举动的歹意水平。歹意水平,若何量化?可以从成果去推导,用户操作获得的数据成果整合后,若是这些内容流出,对公司造成丧失水平。

把歹意水平和丧失水平做了一个对等变更,若何看丧失水平呢?经由过程和营业方调研领会到泄漏出去的数据,包括的内容和内容的组合,若是会推算出一些不公然的数据,或经由过程单位数据加工可获得一些财政数据,这类就属于丧失比力高的了。

本来如斯,分歧丧失水平实在和疑似泄漏的数据集的特性有瓜葛。这个数据集不必定是从有一个表导出的,也有多是好几个表数据组合的。和数据量明细或许不必定高相干(分歧特性的权重是纷歧样的)。

到了这一步,焦点逻辑就收拾出一个大要轮廓了:找到某个用户一系列操作举动组合出的数据集的特性,与咱们的方针值(丧失水平较高的数据集)特性,他们的类似水平,类似度越高,危害越高。

5)明白具体方案

如今,产物思绪理清花季视频晰了,咱们可以去和算法同窗会商,利用甚么样数据发掘/呆板进修的算法可以或许告竣需求方针。固然,还会碰到算法同窗提出的一些此外问题,必要配合会商再进一步得出更具体的解决方案。

好了,这个例子对付需求阐发说的比力具体,经由过程对需求不竭抽丝剥茧,一步一步深刻,最后获得一个解决方案。

将来会继续对数据决议计划相干做探究。

作者用了一个虚拟的案例,或说一个思惟实行,与现实上数据平安审计的雷同场景会有分歧的处所,可是解决问题的思绪很值得进修和思虑。
#专栏作家#
大鹏,公家号:一个数据人的自留地。人人都是产物司理专栏作家,《数据产物司理修炼手册》作者。

本文原创公布于人人都是产物司理。未经允许,制止转载

题图来自Unsplash,基于CC0协定。

收藏回复 显示全部楼层 道具 举报

您需要登录后才可以回帖 登录 | 立即注册

QQ|Archiver|手机版|小黑屋|肥猫SEO论坛 ( 鄂ICP备16024533号 )

GMT+8, 2024-11-22 17:47 , Processed in 0.017723 second(s), 19 queries .

Powered by SEO论坛 X3.4

Copyright © 2016-2022, 武汉肥猫网络科技有限公司.

快速回复 返回顶部 返回列表