本内容来自:投资组合

大信息:下一个金融前沿

许多投资者在大数据周围陷入炒作,但下一个重要的金融前沿将是大信息。

我们周围的世界正在迅速变化。很明显,未来将作为我们作为我们的互联网世界,移动电话,计算机和卫星导航世界的未来,这将是早期的几代人。

虽然物理和工程是这些现有技术的基础和未来(尚不不可知)的发展,但它们的普通分母不是量子物理或纳米技术,而是信息。我们被收集,传输和操纵数据的技术所包围,并最终需要将其转换为信息。这种数据的纯粹数量很难理解。每天的每一分钟,互联网处理200多万电子邮件,200万码谷歌搜索查询以及几乎不可估计的财务数据。在一分钟内,CERN的计算机可以产生600千兆字节的数据 - 相当于每秒两个高清视频下载。亚慱体育app单个MRI扫描可包括多达10千兆字节的数据,但可能含有一条信息:疾病的存在或不存在。

这种洪水已经被时尚术语所知大数据然而,大数据存在一个问题:无论它有多“大”,它仍然只是数据。尽管互联网是最大的存储库的数据我们人类所建造,谁看着整个Twitter或者寻找小猫视频将意识到这是非常难以找到潜伏在大信息数据的未分化的混乱。亚慱体育app剑桥大学(Cambridge University) Cantab Capital信息数学研究所(Cantab Capital Institute for The Mathematics of Information)最近宣布成立,其任务是在成像和机器学习等不同领域发现信息问题的解决方案。

信息问题在金融中特别严重。当人们谈论作物和沃尔玛停车场的新卫星成像或为消费者趋势开采Twitter Feed时,通常会发现大数据炒作。但金融中最大的大数据来源是历史。有人应该如何处理已经存在的历史财务数据的PETABYES(以及每分钟产生的新历史数据的千兆字节)以获得最佳的投资决策?

为了解决这些相当大的障碍,应用数学和统计数据 - 是什么都被称为信息科学 - 这是必不可少的。

投资者只有历史数据(除了那些使用占星术或塔罗牌的人),他们做出的每一个决定都在某种程度上受到历史数据的指导。不幸的是,历史数据中存在大量的噪声和多余信息,从这些数据中提取信号或相关信息非常具有挑战性。此外,投资者对历史信息的信心和他们将其作为投资过程的一部分的承诺是不一致的。

这方面的一个例子是资产负债建模养老基金.等式的负债一方使用关于大群体的生活方式和习惯的历史数据来预测退休年龄和死亡率的统计分布。由此,可以确定未来负债现金流量的一个非常精确的概率分布。

对于等式的资产方面,历史数据的使用不太一致。尽管数据可能显示,例如,价值投资的表现优于市场,或某些系统性风格始终能增加价值,但投资者不太倾向于使用这些数据来严格定义他们的过程。

这是为什么呢?在几乎所有情况下,这都是两种数据或信息偏差的结果。投资者认为,数据中既有证券选择信息,也有证券时机信息。例如,投资者可能认为利率明年肯定会上升,所以现在不是进行风险均等投资的好时机。或者,投资者可能认为,他自己对数据的分析或预测者的分析表明,购买某种证券或资产比购买其他证券或资产更好。

虽然在历史数据中有一些时间和选择信息,但与噪声相比,信号很小,难以捉摸。只有复杂的信息科学技术和大量的计算能力才有希望从数据中提取信息,因此,大数据驱动的投资过程最好留给专家。相反,对于绝大多数技术水平较低的投资者来说,大数据革命很可能只会强化对投资流程的传统看法:做过去行得通的事,因为将来也可能行得通,并且尽量不要太频繁地改变主意。

伊万·柯克(Ewan Kirk)是Cantab Capital Partners LLP的首席信息官和合伙人,该公司是一家规模达数十亿美元的系统性资产管理公司。Cantab Capital Institute for The Mathematics of Information位于剑桥大学的数学学院内,旨在促进信息数学的进步。