大数据突然是一个大问题。5月下旬,在Michael Milken在洛杉矶的金融标题的年度聚会中,一个中心舞台主题是越来越强大的计算机和软件的影响及其从巨型数据集中提取意义的能力。该会议以奥巴马总统2012年的2012年博马纳竞技经理,吉姆·墨西拿主管,专注于大数据,专注于一个小组。梅娜讨论了大量信息有助于获得胜利的信息。但它是一个交易小组,对血腥,机器人和大数据的看似无可救药3月的血肉血资和投资分析师界定了挑战。
长期担任对冲基金公司D.E. Shaw & Co.董事总经理的路易斯•萨尔金德(Louis Salkind)最清楚地描述了大数据的挑战:萨尔金德拥有纽约大学(New York University)计算机科学与机器人博士学位,他描述了分析机器与证券分析师之间日益加剧的对抗。在长达一小时的讨论接近尾声时,他描述了一个自动化程度不断提高的世界,在这个世界里,供应商创造出“分解Twitter和Facebook”的产品,并聚合交易信号。“想象一下,当他们开始使用大数据技术来研究基础数据时会发生什么,”他说。他讲述了一个故事,一个经纪人利用沃尔玛(Wal-Mart Stores)停车场的卫星图像来预测季度收益。“当人们开始整合这些形式的数据时,就会出现一个不同的世界。”
Salkind和D.E.Shaw长期以来一直是在使用计算机进行交易和投资的创新者。但有些人认为,自动化和人力从业者之间的斗争,这席卷了交易所,交易地板甚至监管和遵守,已达到新的前线:证券分析。
计算机和软件在跟踪复杂的市场模式或监控和分析新闻报道、社交媒体和其他数字资源中的数据点方面显然具有优势。众所周知,电脑从不需要上厕所或要求加薪,尽管它们确实会发生故障。它们的发展速度越来越快,功能也越来越强大,它们可以获取更多的数据。大数据的拥护者们预测,普通分析师将被那些能够以卓越的结果解读市场的电脑淘汰。他们甚至相信,大数据将让机器从当下的喧嚣中辨别未来——选举、股票价格或一家公司。他们表示,大数据不仅会重塑交易,还会重塑长期投资实践。
其他人是持怀疑态度的。无论在人们参加市场和经济,无论汇总和分析多少数据,将来都是不可预测的。到目前为止,实际的性能结果已经薄:我们遭受闪存崩溃,不快乐的金融冲击和隐藏在平原视线中的气泡。人类分析师无法处理机器可以的数据泛滥,但它们具有算法缺乏:如果易于恐怖,判断,判断。人体分析师可以称重可能无法降低量化的模糊值;平衡长期和短期视角;关于公司及其期货直接的利润;预测技术,品牌或时尚的演变;并应对歧义和复杂性。
这种人与机器的冲突只是一场持续了几个世纪的斗争的最新一章,随着机械织机取代家用纺车,这场斗争愈演愈烈。尽管结果尚不清楚,但显而易见的是,在这些强大的新工具的影响下,证券分析领域将发生变化。这项技术很可能会改变已经不稳定的证券分析经济学,并进一步筛选分析师队伍,将他们分为能有效使用新技术的和不能有效使用新技术的。大数据可能会一直存在下去。更大的问题是,我们如何面对它?
这一趋势的核心是算法,即告诉计算机如何搜索和解释数据的一系列步骤或指令。当与计算机结合在一起时,这是一个简单但强大的概念。消费者每天都会遇到算法。除了日常任务,从拼写检查到GPS路线指导,再到网上购物,算法还可以帮助客机飞行,进行医疗诊断,甚至手术。不久他们就会开车了。
算法也普遍存在财务中,从高频交易到复杂的估值计算到经济预测中的一切中发挥着作用。他们剥夺了在卑鄙的全球财务日常水中洗涤的信息 - 现在在Petabytes或数十亿兆字节中测量的数据。在几周内,没有人类的人类可以在几周内突出这些算法,在第二个部分中,他们需要通过数据流失。
算法擅长执行快速,几乎无限的计算。但是,他们需要数据作为原料。该数据被大量使用越来越多,其中大部分是世界上除财务分析的传统谷物:价格,估值比率。被称为新闻分析一个发展的领域 - 越来越强大的计算机系统,从新闻,财务报表,博客和其他数字文本,其中的见解可能潜伏挤压市场的格局。海量的数字记忆保持标签上实时成千上万的公司,连同他们的竞争对手,客户,供应商和投资者。
新闻分析来自财务比率阵列与首席执行官转型给中国农村股票,行业,同行团体或市场的当地工作停止转型的因素。程序扫描视野和标志事件,具有市场影响。一些算法甚至泵出了媒体消耗的新闻更新。
新数据可以产生趋势,并根据市场情绪、供应链关系或新闻事件将新的同行群组联系在一起。对投资者来说更好的是,新奇的同行群体往往呈现出独特的交易模式。
“这个信息来源是否会改变投资行业?毫无疑问,潜力就在那里,“威斯利陈说,金融博士。高盛&恤师傅的高盛;波士顿Acadian资产管理股票选择研究总监,是一家总基于基于新闻分析的投资经理。“几十年来,会计和市场数据对投资业变得非常重要。没有理由认为新闻分析在更短的时间范围内不会产生相同的影响。“
这对证券分析师意味着什么?一些大数据的支持者认为,计算能力和预测算法将取代传统的分析师,进而取代传统的投资方式。结果取决于这些基于算法的预测系统的有效性,以及传统的投资研究和积极的投资组合管理能否成为生存的有效理由。
然而,人的判断的长期核心地位的倡导者认为,在算法的心脏二元决策不一定让世界更可预测和长期投资的优劣将持续存在。毕竟,每个算法有一组由单纯的人设计的指令;就像经济模型,算法将世界简单到管理输入和输出。人类专家指挥比算法更广泛的知识和方法运用的经验,算法不能,詹姆斯·欧文·韦瑟尔,逻辑的助理教授和科学的加州大学欧文分校的理念,笔者说:《华尔街物理学:预测不可预测事件简史》(The Physics of Wall Street: A Brief History of Predicting The不可预测事件简史)。
医学研究提供了一个经典的例子。1972年的研究要求在生物清单,193年霍奇金淋巴瘤患者的生存期内预测诱发人。专家预测与实际存活时间之间的相关性为零。但是,这些医生产生的活检和通过多元回归模型的编码准确地预测了生存时间。威慑此操作说明了人类和自动角色之间的关键差异。研究人员更好地识别计算机需要运行的变量。计算机可以更有效地综合以系统的方式来制作预测的信息。
在金融领域,算法已经主要是在贸易自1980年代起的作用越来越。但随着D.E.肖的建议Salkind的,公司拥有专有算法已经把他们的野心购买并持有的投资和基本面。供应商如彭博社,道琼斯公司和汤姆森路透已加入羽翼未丰的企业的不断扩大收集有相似的名字亚历山大投资研究与技术那AlphaGenius技术那Dataminr那数字镘那卢博纳研究那MarketyCh.那叙事科学那Quantopian那RavenPack和未来的记录。
这些公司出售各种各样的新闻分析。这三家公司汇集了各种互动产品。Eikon由汤森路透(Thomson Reuters)推出,在用户友好的市场趋势、证券价格窗口中部署新闻分析,甚至在数字地图上显示远洋货轮的确切位置。单独来看,货轮的座标可能不会改变公司的前景,但结合新闻、天气状况和市场需求,一场严重的风暴可能会影响市场价值。
同时,启动AlphaGenius矿山Twitter流量的市场信号。记录未来席卷各大新闻刊物,贸易刊物,政府网站以及对未来事件的显性和隐性的迹象财务数据库。RavenPack提供数据产品和先进的可视化工具,确定国家或公司为其情绪或媒体的关注是高还是低。在搜索的市场格局,亚历山大适用于人类基因组研究开发的计算机技术。卢塞纳研究,由前F-15飞行员技术博士学位的佐治亚理工学院成立机器人,夫妇人工智能与投资策略。Quantopian装备科学家的手段来开发和后台测试自己的财务算法。
今天的分析技术远远超出了早期呼吸的简单词数,进入新闻分析并试图跟踪市场情绪。那些努力标记为正面或负面的话,锚定在简单的假设中,消极的词总是意味着坏消息,积极的话总是意味着好。背景,长期以来的人类判断力,已经变得至高无上。
用于利用新闻分析和市场情绪的窗口不仅仅是在黑暗池中就像股票贸易一样闪光;他们可以,从业者断言,最后几天,几个月或更长时间,从而与投资分析相关。“我已经看到了客户关于我们有关投资视野的信息,长达三年,”Ravenpack和前投资组合经理的定量研究总监彼得哈菲兹说。他的客户寻求数量框架,以获得不需要分析师解释的新闻。“当您获得更强大的新闻分析和更多信息时,您可以绕过分析师并在数据本身中找到价值,”他说。
2月份哈佛商业评论发表了一个案例研究,在录制的未来借给验证,情绪检测,一个分析初创总部设在马萨诸塞州剑桥市。报告了分类根据感悟500只股票录好的未来战略研究,然后买了前10%和短底的10%。“RF自己的分析表明,如果投资者曾跟随其有关在标准普尔500指数在过去一年中股市预测和投资建议,他们会大幅跑赢市场,”根据个案研究。
在过去几十年学术研究倾向于到利用消息印证策略。“低资本化,年轻化,无利可图,高波动性,不派息增长的公司,或公司的股票在财务困境的股票,很可能是对投资者的情绪,广义波不成比例的敏感,”研究人员哈佛大学和杰弗里的马尔科姆·贝克纽约大学的Wurgler报道在2007年的论文“在股市投资者情绪。”其他的研究一致认为,情绪的信号可以产生的市场变化提前预警,虽然意见的持续时间和影响的大小而变化。
为了测试新闻分析的价值和寿命,德意志银行(Deutsche Bank)最近发表了一系列研究论文,重点研究最先进的情绪分析。定量策略师Rochester Cahan和他的同事研究了在股票选择中使用新闻——行话中称为非结构化数据。他们的结论是:新闻和互联网数据的真正价值不在于简单的多正、空负情绪策略。
德意志银行团队得出结论说,从绝对意义上讲,市场人气相对于市场预期的意义要小得多。成功的金融模型通过捕捉市场情绪和价格、成交量等市场数据变量之间复杂的相互作用,从新闻中提取阿尔法值。“如果一家公司有很多好情绪,人们在博客上写好东西,在twitter上发好东西,人们就会自然而然地认为这是一个好故事,你应该买入,”卡恩说。“市场不是这样运作的。重要的是期待。”
情绪为预期提供了微妙的代理。关注新闻分析的TABB集团(TABB Group)高级分析师小e·保罗·罗瓦迪(E. Paul Rowady Jr.)说,价值、偏见和背景都涉及肤色情绪。裁员对情绪来说可能是好事,也可能是坏事,这取决于裁员的背景。一些是买入信号;其他人,卖出信号。对福特汽车(Ford Motor Co.)的供应商来说,坏消息可能意味着对通用汽车(General Motors Co.)来说是好消息,也可能不是。市场领先者的强劲收益可能会迫使竞争对手争相维持市场份额,或者反过来,乘势而上。编程得当,新闻分析算法可以识别上下文中的含义和情绪。
最终,Rowady预见到普遍访问的数据和计算火力足够强大,以吸收实时发生的一切,然后表达市场情绪。“这基本上是我们所在的地方,”他说。
CAN新闻分析产品预测市场未来,比传统分析师更好吗?这是一个抵抗明确答案的问题。一方面,新闻分析公司签署协议不会泄露客户的名称,可理解地不想暴露投资策略。(据报道,许多更大的公司一直在使用这种算法工具。)此外,这些分析系统是多种多样的,更快地变化。除了供应商和罕见的推荐方面的反向,还有成功或失败的证据在很大程度上是间接和粗略的。
蓬勃发展,新闻分析法必须提高上面安装和操作复杂的系统的成本可量化的收益。租赁新闻分析系统以及数据提要可以花费$ 5,000到$ 20,000一个月,根据功能,数据的刷新频率和座位数。这是特别是对新的,规模较小的企业是一个挑战。
尽管如此,仍然有球迷。凯文·谢伊是信心的回报大于成本。“If I can’t get at least 3 to 5 percentage points of alpha from a factor, I’m not interested in looking at it,” says Shea, a veteran of Cadence Capital Management, Batterymarch Financial Management and Invesco who launched Boston hedge fund Disciplined Alpha this year. As its name suggests, the firm adheres to a systematic investment strategy. Its algorithmic approach, developed by Los Angeles–based Alexandria, is rooted in bioinformatics, an information technology that emerged from genomics. Conceptually, analyzing the genome sounds pretty mechanical; after all, DNA may be long, but it only has a four-letter code. But that code features deletions, mutations and “junk” sequences along its 3 billion base pairs, and its interactions with RNA and the assembly of proteins has proved to be extremely complex. Context and relationships matter, just as with financial information.
有在途中亚历山大“火车”的算法来产生的市场洞察力背景因素。而不是预先分配正面,中性或负面含义的单词和强加的规则进行分类的情绪,亚历山大分析了一项研究55000名的文件被视为正面,中性或负面的外部投资专业人士和搜索的结果支持的评估更深的共性。当喂5,000个新的文件,该算法匹配的人评估时的91%,乳木果说。
尽管如此,91%的命中率,以一个观察者的样子9%的命中率到另一个。在高音量这是一个很大的失误,但人类的评估并不一定更好。此外,该程序处理的,否则可能逃脱的通知文件数以万计。
如果没有大量的股票筛选通过回测,正式的风险模型和情绪信号的肯定,谢伊说,纪律阿尔法就很难产生一致的基础上令人满意的风险控制性能。至少在纪律阿尔法,这个算法是静态展开试验。
丹尼尔•桑德伯格(Daniel Sandberg)也在探索算法驱动投资的潜力。2012年,桑德伯格获得了康涅狄格大学(University of Connecticut)的计算物理化学博士学位,然后和他的几位同行一样,进入了金融业。他加入了弗吉尼亚州夏洛茨维尔(Charlottesville)的投资咨询公司Legacy Foundation。如果算法能从科学研究中提取出有意义的信号,桑德伯格认为它们没有理由不能在金融领域工作。于是,他开始开发自己的算法,与风险投资支持的波士顿初创企业Quantopian合作。Quantopian提供后台测试、数据反馈、算法编写和用户社区等工具。他的第一个项目是一个用于执行部门轮换策略的算法工具。
就其本身而言,Quantopian正试图将算法开发大众化,面向Legacy等规模较小的资产管理公司,甚至面向消费者。它声称拥有首个基于浏览器的算法交易平台。该公司正计划发布一个折扣交易平台,这意味着算法交易和算法开发可能会进入零售投资领域。
一些怀疑论者继续发现新闻分析少于令人叹为观止。“也许我们在曲线后面,但这不是我们在这里使用的话题,”全球投资公司的股权研究主任说。纽约的投资技术集团为对冲基金提供许多服务和第三方研究;事实上,它的一个营销口号“来自噪音的解码信号”可能来自一个大数据供应商。但ITG没有“新闻分析中的交通”,发言人说。2011年底,伦敦的Derwent Capital Markets在Twitter上推出了一个基于Twitter的基金,在运营的第一个月内庆祝了巨额1.85%的收益。一年后,随着期望的回报,Derwent关闭了基于Twitter的基金。
纽约证券分析师协会(New York Society of Security Analysts)另类投资委员会(Alternative Investments Committee)前主席克里斯托弗•卡特勒(Christopher Cutler)认为,人的判断和监督似乎具有弹性。“这会成为一个重大的游戏规则改变者吗?””他问道。“我不会高估它。投资的基本面方面,有太多东西只有人类才能看一眼。”作为例证,卡特勒引用了一位分析师和一位公司高管之间的对话,从中洞察到竞争对手对产品的错误定价。
T. Rowe Price的集团长期以来凭借其传统的买入并持有的投资策略蓬勃发展起来。“自动驱动器上的进程也许会做出一些钱,但在我心目中这不是魔法药水,”该公司的美国股权交易主管安德鲁·布鲁克斯说。“威尔40000个新闻稿把你带入LinkedIn在$ 6和住宿$ 200?我不认为通过读取大数据发生了。”投资组合保险是在80年代中期热点,布鲁克斯回忆说。然后是1987年的崩盘。送什么市场纺纱?“投资组合保险”,他说。
新闻分析法顶多至今无一人的总部设在香港市场分析师麦格理集团,该集团赞同新闻分析法,并在合作与RavenPack,销售工具,以全球银行客户伯克刘说。发现和纠正错误的信心算法模型(也许,反之亦然)人类是必要的。一个典型的案例流行的:当电子交易商骑士资本集团的新软件在2012年8月发生了故障,释放出买盘的交流洪水,数百万美元基本上是一个人的面前消失了 - 或人 - 不得不进行干预。
计算机适合于寻找特定的数据集并预测结果。但是,当意想不到的事情发生时,计算机没有能力在没有人为干预的情况下做出反应。例如,IBM公司的国际象棋计算机“深蓝”击败了俄罗斯冠军卡斯帕罗夫,但仍无法在扑克游戏中虚张声势或识破虚张声势。扑克游戏更像交易,而不是国际象棋。
“在国际象棋,你能得到你需要知道一个圆圈周围的一切,而谁知道是怎么回事影响汽车工业?”莱斯利英姿飒爽,计算机科学与应用数学T.杰斐逊柯立芝教授在哈佛大学和2010上午得主说:图灵的杰出研究奖计算。计算机看到的一盘棋移动提前一个壮观的数字,但截至目前,忠烈说,“我们不知道如何使它们复制常识。”
算法在他们可以在最小的人类干扰提供投资建议之前有更多的学习。但是,分析师希望判断总是胜过算法可能面临着一个粗鲁的惊喜。当智能手机所有者可以作证时,自然语言处理允许算法分析日常英语,取得了进步。读扑克诈唬需要对语义细胞的敏感性。使用多种算法的Deew Blue的IBM继任者命名Watson,着名的人类冠军危险!部分是准确地解析游戏显示的WordPlay。
“在金融市场中的语义搜索的出现是强迫金融专业人士消费和分析信息的方式的转变,最重要的是赚钱,”Haris Husain说,汤森路透社努力开发植物的智能搜索工具语。
这可能证明是证券分析师的摩擦,他们已经遭受了超过十年的痛苦变化。通过投资资本加油初创公司和大量的精明工程思想从事设计更直观的算法,证券分析师可能面临重大的破坏。最好的将生存和繁荣;其余的可能落到机器上。
克里斯托弗·施泰纳更进了不少。施泰纳的作者自动化:算法如何统治我们的世界,是前福布斯技术编辑和当前互联网创业者;他对前景不仅是证券分析师,但对于专业的投资组合经理看淡。“十年以后,我没有看到一大堆的余地资金活跃的经理,”他宣称。
这可能接近于预言世界末日的边缘,但显然在整个白领经济中有更大的力量在起作用。诺贝尔奖得主、普林斯顿大学(Princeton University)经济学家保罗•克鲁格曼(Paul Krugman)在一篇文章中呼应了这一警告最近的纽约时报列旨在思考高级学历的工人意味着工作保障。“他写的技术对劳动力的影响更为黑暗的照片,”他写道。“在这张照片中,受过高等教育的工人可能与受过教育的工人一样可能发现自己流离失所和贬值。”
在这种情况下投资研究可能需要间或überanalysts数量较少的定量分析师谁五月召开会议专门讨论大数据面板Instinet公司董事总经理约瑟夫Mezrich说。
管理金融学教授安德鲁·罗,谁指使学校的实验室金融工程的麻省理工学院斯隆商学院说,尽管如此,这些都是新闻分析法的初期阶段。罗看到了算法,可以从新闻中提取数据利多前景。把新闻分析工作,他说,要不投降无数机会保持领先其他投资者当市场移动。“不管你多少来预测市场行为,”罗说,“这将永远是新闻的体积会产生尖峰波动的情况。”
我们需要知道的是,这种由新闻驱动的波动是昙花一现,还是实实在在的发展,是夏季风暴还是气候变化。要是有个算法能告诉我们就好了。••