【财新网】(记者 吴红毓然)11月6日,工商银行原行长杨凯生在“第六届财新峰会:金融创新与稳定”分论坛上表示,在继续推进金融创新的过程中,应该避免陷入技术至上、唯数据论的误区。
近期,北京大学国家发展研究院教授沈艳发表了一篇文章,《大数据分析的光荣与陷阱——从谷歌流感趋势谈起》,该文指出:大数据分析在实践中会出现巨大的系统性误差,因此,在数据分析中,不能只关心相关关系而不注意因果关系,必须避免模型对数据值“过度拟合”。沈艳提醒,不能以为大数据可以完全替代小数据,她呼吁要防止坠入“大数据陷阱”,力戒“大数据自大”。
“沈教授所指出的问题,正是若干年来,我们在推进互联网金融发展中一直十分注意和努力想解决的问题。”杨凯生指出,多年来,银行业在如何利用数据技术提升风险管控能力方面进行了很多探索。
以工行为例,在信贷风险方面,工商银行在非零售业务和零售业务的客户违约率、损失率数据积累长度均已超过12年。在公司业务方面,工行开发了34个法人客户评级模型,开发了175个信贷产品的3类债项评级模型;在零售方面,开发了75个信用评分模型。在市场风险方面,工行制定了16个办法,开发了17个定价估值模型来进行风险价值(VaR)和压力风险价值(SVaR)的计量。除此,工行建立了全行数据质量的管理标准和平台,进行内部评级的复核验证,以尽可能减少失真数据的干扰和影响。
“为了达到上述的这种数据采集、挖掘和应用水平,仅为积累有关数据、开发这些风险管控模型,工商银行就先后花了将近15年时间,投入了巨大的人力和财力。”杨凯生说,“坦率地说,我们从来也没有认为这一切已经是完美无缺的了。”
面对汹涌的互联网金融,杨凯生强调冷静。他认为,面对不断变化的社会经济环境,随着银行业务日新月异的发展,在数据的管理利用方面,金融业确实还有许多问题需要解决,前面的路还很长。
“许多事确实不像想象的那么简单。”杨凯生对所谓的“大数据”提出了一堆问题:如果真的要搞金融大数据开发,真的要靠有关数据来办互联网金融,就要认真思考一下,自己所谓拥有的“大数据”真的足够大了、足够长了吗?自己拥有的数据中的信噪比问题有效解决了吗?人们的社交行为数据、那些非结构化数据都是真实的吗?
杨凯生认为,这还没有涉及诸如homes系统、高频交易等技术,在这一轮股市风波中的作用究竟应该如何认定的问题。“尽管有这样那样的看法,但可以确定的是,在某些条件下,所谓的技术中性在面对市场时是完全可能发生变异的。”
“互联网技术是时代进步的标志,是现代文明的产物,它与那些江湖气其实是不搭的。”杨凯生指出,金融的创新、互联网金融的发展,除了技术还需要一系列的条件支撑,包括营造一种良好的文化氛围。“在眼花缭乱之中,要力戒浮躁,脚踏实地。”
杨凯生认为,互联网圈一些诸如“流量为王,就是要靠烧钱来吸引客户”,“互联网就是财富重分的过程,就是赢者通吃的游戏”,“羊毛出在猪身上,猴数钱,牛买单”等说法,“如果仅是开开玩笑、说说段子,那也未尝不可,但作为一个要对投资者负责、对债权人负责、对债务人负责、对市场稳定负责的金融从业者来说,如果把这真的当成了自己的经营理念,那是万万不可的。”