人行征信报告(上篇)-一代征信报告的变量梳理
在风控规则的梳理中,人行征信数据是非常重要的模块,特别是对持牌金融机构而言,征信数据就是最重要的外部数据源。对接好,征信数据之后,下一步就是需要将报告中的字段梳理成各种符合业务逻辑的变量。如何梳理具体的征信报告数据?我们为各位读者分享人行报告的变量数据。
此系列文章分为上下篇,此篇为上篇为各位介绍一代人行征信报告的变量梳理。下篇将为各位读者分享二代征信报告的相关内容。
之前,我们提到一份完整的征信报告包括的内容,具体报告内容如下:
细细梳理,任何关于一份征信的内容,主要包括的内容如下:
以上三个模板的字段信息,我们进一步梳理成一下具体的变量细则,对应输出的变量的名称与变量的逻辑如下:
贷款方面
贷款方面的数据,根据征信的情况,可以按照逾期的状态跟逾期的天数交叉结合成不同时间切片的数据,具体我们可以衍生出以下的变量的逻辑,即为多长时间内,还款记录中逾期状态的出现某状态的次数,以下我们举例说明:
1.贷款最近3个还款期出现M1(逾期1-30天)或以上的记录次数:
ap_pbc_loanlist(row)贷款明细中,每笔贷款做以下条件判断,返回满足条件的次数(每笔求和);
条件为:最近三个月还款记录是否出现>=1
2.贷款最近3个还款期出现M2(逾期31-60天)或以上的记录次数:
ap_pbc_loanlist(row)贷款明细中,每笔贷款做以下条件判断,返回满足条件的次数(每笔求和);
条件为:最近三个月还款记录是否出现>=2
....
3.贷款最近6个还款期出现M1(逾期1-30天)或以上的记录次数:
ap_pbc_loanlist(row)贷款明细中,每笔贷款做以下条件判断,返回满足条件的次数(每笔求和);
条件为:最近六个月还款记录是否出现>=1
….
贷记卡方面
类比贷款的内容,将贷记卡的信息,也按照时间跟逾期的状态衍生出以下方面的内容:
1.贷记卡最近3个还款期出现M1(逾期1-30天)或以上的记录笔数:
ap_pbc_creditlist(row)信用卡明细中,每张贷记卡做以下条件判断,返回满足条件的次数(每笔求和);
条件为:最近三个月还款记录是否出现>=1
……
2.贷记卡最近3个还款期出现M3(逾期61-90天)或以上的记录次数
ap_pbc_creditlist(row)信用卡明细中,每张贷记卡做以下条件判断,返回满足条件的次数(每笔求和);
条件为:最近三个月还款记录是否出现>=2
……
其他方面
征信数据中,其他方面的数据有一部分是包括在贷款跟贷记卡的信息里面,但因为这些变量在做规则和模型中,信息熵大,所以单独拎出来做成某些规则:
1.是否有未结清汽车贷款且最近3个月有过逾期:
ap_pbc_loanlist(row)贷款明细中account_state_name账户状态<>结清+loan_type_name贷款类型=个人汽车贷款+近三个月逾期(逻辑为非N,*)
2.未结清贷款笔数:
取ap_pbc_shareanddebtsum(row)中,share_name=未结清贷款时,account_count的值
3.当前是否有未结清助学贷款:
ap_pbc_loanlist(row)贷款明细中 account_state_name账户状态<>结清+loan_type_name贷款类型=个人助学贷款
最后本篇文章所提及的征信报告以及对于的征信的数据变量字段,我们都梳理成具体的字段都统一上传到番茄风控大数据上,大家可以上去查阅,谢谢。
~end~
期待下篇的分享~