金融中的大数据和数据科学

数据科学和大数据无疑是支持未来决策系统的一大方向。那么金融,特别是风险管理中哪些地方用到大数据和数据科学呢?这个帖子聊一聊。总的来说,金融市场开放,参与个体差异大,对数据和系统的需求和依赖千差万别,这里主要针对机构来说。对数据量需求最大的应该是在风险管理 和 marketing。像trading 和portfolio management,更多的是要能快速执行,所以处理的数据并不多。金融风险主要有几个大类,credit risk, market risk, operational risk, liquidity risk的等等。

credit risk 指的是借钱的一方无法按照合约履行还款业务的风险
market risk 主要指的是市场环境的变化比如利率的变化对asset value带来的影响
operational risk 比较宽泛,涵盖所有维持正常operation 所需要的风险,比如说system breakdown, power outage, fire, cyber-security issues, etc.
liquidity risk 指的是当市场交易活动大幅减少时, asset不能快速变现而导致储蓄金,cash不够,或者是融资渠道被堵等等,对于投行有巨大的影响

(待续)

1 Like

这里先讲一下商业银行的基本业务。商业银行提供储蓄和借贷业务,规模大些的银行也会有wealth management和investment arm. 首先银行通过branch office还有广告投放的方式吸引客户存款。用户存款并不会都存在银行的账面上, 按照Fed的规定,不同规模的银行需要reserve不同比例的准备金额来应对用户提款,以及部分现金应对stressful time。除此之外银行会尽量地把钱借出去,无论是车贷,房贷,个人贷,商业贷款,信用卡等,银行希望能够尽可能多的发放贷款。银行从各种贷款收回的利息减去银行支付给存款客户们的利息就是银行的毛利润。从这毛利润里减去运营成本,再出去损失就是银行的利润。这其中存款,贷款额度,以及portfolio的坏账率是最关键的指标。每个指标都会有大数据支持分析,预测和决策。而且都有各种统计,数学模型的支持。 (未完待续)

1 Like

有意思

接下来说说大数据和Data science的运用,离我们用户最近的是marketing。相信每个人都有这样的经历,自从在银行开了账户,隔三差五的就会收到各种邮件deals: transfer money, new credit card, personal loans的优惠等等。每个人都会这么被银行骚扰吗?大概不是。每个人收到邮件的种类和频率一样吗?当然不是,这里面有大数据在背后支撑。银行每发一封邮件,是有材料和邮费的成本的。如果所有人只把邮件广告拿来垫箱底那这个银行的Marketing analysis 部门可以关门了。每一类邮件是有一定的反馈率的:用户查看了或者申请了相关的服务,给银行带来收益。Data scientist要给客户群体分组分类做segmentation,针对每一个segment都会有不同的广告投放策略和目标,比如说信用记录少的大概是学生或者是young professional,会对信用卡promotion感兴趣。信用卡多的,也许需要personal loan来consolidate debt,已经有mortgage的,会不会需要home equity loan?信用分数高的消费能力如何,分数低的又更倾向哪些产品,如此等等。分析用户数据,分组分类,确定marketing strategy, 测试strategy ,调整策略,follow through campaign…这是一个iterative process。decision science,regression,classification在这里都有很多应用。银行有着海量的数据,各种ML算法在hadoop平台上能够大显身手。(待续)

1 Like