Rob Goldstein, chief operating officer and global head of BlackRock Solutions, and Jody Kochansky, head of the product group for Aladdin, the firm’s portfolio management system, can’t describe the future of data science at the $5.1 trillion money manager without comparing their ideas to the way things worked in the past.
分析数据对这两位高管来说并不新鲜。在一次讨论中,Kochansky和Goldstein不断地打断对方,活跃地讨论机器人、人工智能和机器学习。贝莱德两人开始他们的职业生涯一个二十多年前在标志性的绿色计划,风险分析报告的套件,它的名字来自唯一可用的拷贝纸的颜色在大楼里一个晚上后不久,该公司于1988年成立。“大数据不是数学或方法上的突破,”戈德斯坦说。1994年,科尚斯基大学一毕业就聘请戈德斯坦为分析师。“这是现在可用的数据和分析数据的计算能力。如果你把我们放进时光机,把我们送回20年前,我们会告诉你,你所说的用数据做的事情是不可能的。”
Kochansky负责监督超过1,500名开发人员为阿拉德丁,Blackrock的中枢神经系统,比较抵押贷款市场。在其初期,该公司预测房主将如何预付贷款的速度 - 这是一家在复杂抵押证券的专业知识上创立的金钱经理的重要问题 - 基于借款人的贷款捆绑人的平均信用评分等信息。“现在,小义和弗雷迪在几十年前向你提供了难以想象的数据,关于每一个抵押贷款,”Kochansky说。然而,他强调,它不仅仅是关于数据的广度和数量:它是关于模型的科学,包括测量它们的准确性,在当前经济内拟合它们,并分析相互关联的数据集。“你真的需要大数据来搏斗到地上,”他补充道。Kochansky在该公司的24年内包括一些与Goldstein密切合作的一定的稳定性,其中一家与1998年至2007年建立了阿拉丁业务,并在2009年收购巴克莱全球投资者之后另一次重建该平台。
虽然Goldstein和Kochansky不要大声说出来,但他们的工作在投资成熟业务中发现了新的突破对于维持Blackrock在行业中的首要地点至关重要。其他大货经理和对冲基金正在加强数据科学努力,但Blackrock的边缘是阿拉丁,这是一个共享的存储库,适用于所有公司的见解和想法。
当然,资金管理行业一直依靠模式来选股。但现在,个人和企业已经产生了数十亿条数据——世界上90%的数据是在过去三年里产生的——投资者正在疯狂地筛选这些数据,以发现股票价格走势的新的领先指标。Kochansky说:“我们希望找到不为人所知但实际上能预测未来回报的数据来源。”社交媒体活动、发展中市场大型零售商停车场的卫星图像以及公司研究报告只是丰富信息来源的几个例子。贝莱德的工作是将这些非结构化数据构建成数据科学家可以利用的信息——比如,创建一种算法,在特定日期和时间计算卫星图像中的汽车数量。然后,数据科学家可以使用典型的统计方法分析这些信息——所有这些都在阿拉丁软件中实现。
Goldstein引用了Binghamton University的一位大学朋友,他们成为股权研究分析师,并从11月到1月份度过了三个月,在商场计算汽车,客户和库存。相比之下,他说,拉夫勒萨格尼 - 在Blackrock的科学活跃股票集团的投资联合主管 - 在最近的投资者日告诉客户,他读到了每个公司分析师曾经生产的每份报告。“当然不是他。这是计算机,“Goldstein强调。随着Blackrock的计算机在所有这些分析师的报告中吮吸,监管申请和其他材料,他们试图找到落后的其他线索。例如,它们通过盈利调用的成绩单中的语言进行排序,寻找语气的变化和计数正面和负面词。当然,一旦Blackrock成功地解码了这些报告,那些公司的管理将捕获并试图改变他们无意中发送的信号。虽然显然是一个更加平淡的任务,但是从监管案件中解析了一个关于思想艾伦的线索和他的数学家团队,他们在第二次世界大战期间破解了纳粹代码 - 一旦破裂,曾经突然用过德国从未被抓住过。
数据科学也是贝莱德努力的一部分,目的是让Aladdin复杂的分析和投资组合构建能力不仅提供给其历史上的机构投资者,也通过他们的财务顾问提供给零售客户。亚博赞助欧冠该公司提供阿拉丁财富和FutureAdvisor的服务。FutureAdvisor是该公司去年收购的一个数字咨询平台,通过加拿大皇家银行财富管理公司(RBC Wealth Management)等第三方提供服务。戈尔茨坦表示,监管方面的变化,比如美国劳工部的受托规则(该规则要求退休账户的顾问必须以客户的最大利益为准则),以及类似的全球要求,突显了阿拉丁在零售领域的投资组合构建和透明度工具等能力的好处。大数据技术使贝莱德得以扩大阿拉丁的规模,以成本效益为数百万零售账户提供其功能,并为专注于顾问的批发商提供相关客户信息、模型投资组合和交易思路。
对数据科学家来说,运营是另一个充满机遇的领域。阿拉丁每天进行25万笔交易,每晚运行数十亿的经济预测和情景。例如,该公司正在使用机器学习来检测其庞大的贸易活动数据中的复杂模式,以确定最有可能失败的交易。
Kochansky从早些时候提出了另一个故事,以解释一个更多的机器学习应用:找到异常,他会把那天的绿色包裹放在前一天旁边并手动比较数字。如果风险模型吐出一个有问题的数字,它意味着追踪可能的错误 - 例如,价格不好 - 然后重新运行过程。虽然Blackrock已经自动化了这些活动,但人们对阿拉丁的异常的工作流程仍然是必不可少的,计算机识别需要人为干预的任何问题。
Blackrock的下一个目标是教会电脑解决问题以及识别它。该公司正在建立机器人或应用程序,以使人类决定的判断。“我们每次检测到今天的异常和人类都采取纠正措施,我们正在创建一个巨大的数据集,因此机器人可以了解需要哪些行动,”kochansky说。
人类不会很快消失。长期宣称它不仅仅依赖于计算机模型的Blackrock,这表称这一精神仍将保持自动化进步。“如果你看看这项研究,它就告诉你,”人类加上电脑“将永远导致更好的结果,而不是单独或单独的人,”Goldstein说。
贝莱德很清楚竞争的激烈程度。今天看来很有希望的信号,一旦被别人偶然发现,就会停止工作。如果有足够多的分析师能够根据业绩记录中积极或消极词语的数量,或者CEO和CFO是否一直乐观,从中找到有用的指标,那么毫无疑问,企业将开始改变自己的行为。Kochansky说:“任何边缘的半衰期通常都很短。“这真的一直是一场军备竞赛。”是的,每个人都想要一台英格玛机。
得到更多的资产管理。