决策科学苑 | 算法优化规则的实例

发表时间:2018-07-24 10:42作者:余锴



在之前的文章中已经探讨了使用算法对规则进行优化的基本思路,本文将举一个具体的规则优化的例子,进一步说明使用算法,而不是依赖人工对算法进行优化的必要性。


真实的企业运营中通常会存在一些已有的规则,业务人员会根据市场、或者企业战略战术的变化频繁的对这些规则进行调整。以下假定一个金融机构需要根据贷款申请人的特征进行自动审批(接受或者拒绝),在无法自动决策的时候由人工进行审批调整。为了讨论的简便,我们假设这个审批仅根据申请人的年龄、学历和收入作为LHS(Left Hand Side)设定规则。其内在的审批逻辑为:一个人的年龄越高,学历越高,其收入也应该越高,更具有偿还贷款的能力。


表1 信用审批规则LHS

Table1 LHS of credit approval rules

如图1,在业务刚刚开展的时候,业务人员制定了一套业务规则。首先将年龄分为三类,对应学生(刚步入社会的学生)、具有一定工作经验的普通员工以及资深员工。对于学生群体,业务人员倾向于选择高学历的人群,并不考虑他们是否有收入;对于普通员工,他们的学历应当与收入成正相关,拒绝低于某个收入(根据经验)的申请,否则接受;对于资深员工,审批不再关注申请者的学历,完全根据他们收入判断:过低收入者未来偿还贷款可能存在风险,而过高收入者则可能存在欺诈风险,需要人工核实,对于正常收入返回的申请一律予以通过。

图1 旧业务规则

Fig1. Previous Business Rules


业务在持续一段时间之后,业务人员发现原有的规则存在一些问题。例如许多申请者没有接受进一步教育,较早开始工作,因此他们的收入应当考虑。另外原有的年龄划分存在问题,在中国一般上大学的年龄是18岁,毕业是22岁,因此原有的学生规则覆盖不到绝大部分的本科生。

图2 新业务规则

Fig2. New Business Rules


另外根据合规方面的要求,发放贷款一定要参考申请人的收入水平,于是业务人员又在规则中加入了一些关于收入的条件。图2是根据新业务变化重新设定的业务规则,按照公司管理层的要求,业务部门需要分析新规则与旧规则的差异,说明调整的合理性。

比较图1和图2很容易看出,首先在年龄的划分上存在差异,旧策略中的年龄分割点为24,30;而新策略则为22,28,35,为了进行对比分析,需要在新旧规则中按照最细的尺度(分割点为22,24,28,30,35)重新划分,对齐后进行比较。

图3 新策略改变了年龄分割的尺度

Fig3. New Calibration of Age Caused by New Strategy


新策略还为规则加入了收入的判别条件,因此除了年龄需要重新划分和对齐,对于其他变量也需要这样做,可以想象,这种划分和对齐会形成一张非常巨大的表,以下仅对原有学生群体规则变化进行比较。如表2,原有学生群体以22岁为分割点进行了分割,并增添了关于收入的条件。可以看出,新策略并不完全合理,例如对于22-24岁,高中学历,收入>3k的人群,新策略的审批结果为“接受”,这部分人群的历史平均坏率为16%, 可能是存在业务问题的。另外,新规则还将原有拒绝客群直接予以接受,这会带来很大的风险,因为新的决策规则没有数据的支持,很可能存在审批漏洞。关于这类问题的解决方法,将会在下一篇文章中介绍。


表2 新旧规则比较

Table2 Comparison of New Rules and Previous Rules

通过这个简单的例子可以清晰的感受到,规则的迭代优化是不太可能靠人工完成的。规则变量的重新划分和对齐形成了大量的检查项,有些新的决策会缺乏数据支持,还有一些则需要根据数据不停的重新计算和评估,这种单调而冗长的任务更适合由算法来完成。



文章作者

余锴  

曾在华为、惠普、SAP合作伙伴从事市场、咨询和数据科学领域工作,并在互联网金融行业有丰富的大数据建模、智能算法研发以及决策引擎设计经验。  


 

 

 

干货回顾  


【决策科学苑】复杂逻辑控制与智能规则引擎  

【决策科学院】复杂逻辑控制的实例  

【决策科学院】复杂逻辑控制的概念  

【RTOI学苑】数据驱动下的智能决策  

【决策科学院】决策管理中数据的应用  

【决策理念】做出明智的决策  

【决策理念】将你的老旧代码转变为灵活的决策服务







  



文章分类: 公司新闻
分享到:
关注信数

联系我们


电话     : 021-50196198

E-mail  :   contact@xinshucredit.com

地址     :上海市杨浦区昆明路739号

              文通大厦1209室