【本文为西南财经大学信托与理财研究所副所长、博士生导师、普益标准首席技术官罗荣华先生在“第五届普益标准财富论坛”分享的《大数据时代下的银行理财数据挖掘》主题演讲中的精彩内容。】
从学界的角度来讲,大数据很热,从业界的角度来讲大数据也很热,但是大数据要成功有一个很重要的结合点,就是技术和业务场景的结合。学界有很多非常漂亮的技术,业界有很多非常现实的需求,如果两者不能够很好的结合的话,这个大数据其实是没有价值的。
有一些非常有名的案例,个人征信90年代末在美国就有人研究,但是当时没有成功。为什么现在能够成功,因为技术和场景,特别是业务应用的场景能够很好的结合。普益标准就希望能够一方面从学界、技术做更好的开发,但是另一方面也能够跟业界结合,把我们学界的技术和应用做很好的匹配。
普益标准正在努力的事情是,从产品端数据到机构端数据、行业数据、区域数据、市场数据、宏观数据,全方位地构建一个数据库。基于上述数据库,我们开发了后续的运用,第一个是市场需求的预测,集中在理财市场规模和收益率这个层面的预测,从期限、收益类型、投资门槛、机构类型不同维度进行全方位的预测。
普益标准建立了一个收益率预测模型y=f(m,c,r,s,p,L(y),o)。趋势预测以普益标准数据库为数据基础,以普益标准趋势预测模型为预测依据,提供封闭式产品市场趋势预测。预测内容包含预期收益率和发行规模两个大类,预测分样本类型提供币种类型、期限类型、收益类型、投资起点类型、发行机构类型共计五个维度。
市场趋势预测是基于大数据分析方法,分析宏观环境、行业层面和银行理财产品特征以及产品自身历史情况等因素对理财产品总体发行规模和收益率的影响,并建立计量经济学模型,以预测未来理财产品总体发行规模和收益率的水平。我们用回测的方法选择模型,模型备选是非常丰富的,从各种非线性的到线性的;算法从神经网络算法到其他的一些迭代都囊括其中,选一个预测精度最高的模型,这个模型会随时间来动态调整。
针对封闭式非结构预期收益的产品。普益标准主要从三个角度进行评级考量:违约风险、封闭期限、投资门槛。具体原理就是:通过违约概率模型和违约损失模型进行调整,通过门槛进行分类,来对门槛进行调整,每个门槛内部不同的机构类别建立一个对应模型。期限进行了一个无风险收益率的扣除,我们扣除的时候是选取了最有代表性的基准,是国债和定期存款的加权平均。
我们利用全行业来做定价。模型形式上看起来比较简单,当然技术上其实很复杂,我们把它分成这样的一个部分。B是一个基准,G是由产品的基本特性所决定的,这个基本特性囊括在发行机构类型、投资起点等一系列因素,以及考虑时间因素T。F(T)是重点考虑时间因素的影响、封闭期限的影响。我们有一个结果展示,我们提供了一个很方便的平台,类似于计算机的东西来做操作,可以从不同的维度来进行选择。
普益标准后续还会做其他一系列银行资产管理数据挖掘方面的工作,包括全方位理财市场的画像,包括基于文本挖掘的市场分析,基于金融标准的金融学理论的大类资产配置。
理财画像是大数据在营销方面最热门的方法,与传统的画像有区别,我们传统的画像是银行对用户进行画像。我们现在是对产品进行画像,这个画像能够帮助我们直接地了解做一些有趣的工作。根据我们的阶段性成果,从产品的数量和规模综合来看的热度地图,广东和江苏这两个地方的热度应该是最高的,还可以看得更精细一点,到市一级的。未来还可以把不同的维度交互起来,用气泡图的形式,不同的颜色对应不同的省和直辖市,根据它所处的位置看它的收益和风险是什么样子的,就可以把我们的理财市场的全貌放在一张图里很清晰的做一个刻画。